1337

Математический аппарат для инвестора

Научная статья

Экономическая теория и математическое моделирование

Методика статистического анализа прогнозирования, дескрептивная статистика, анализ временных рядов, оценка автокорреляционных свойств, адаптивные методы прогнозирования.

Русский

2013-01-06

1.41 MB

15 чел.

значениями. Если построена адекватная (хорошая)
МАТЕМАТИЧЕСКИЙ АППАРАТ
модель, то E(t) является близкой к 0, случайной, не
зависимой, подчиняющейся нормальному закону
ДЛЯ ИНВЕСТОРА.
распределения компонентой. В противном случае
 Горчаков А.А., Аудиторская и консалтинговая фирма
модель является  плохой.
«Росэкспертиза»
Основной целью статистического анализа
временных рядов является изучение соотношения
1. Методика статистического
между закономерностью и случайностью в  форми
ровании значений уровней ряда, оценка количест
анализа и прогнозирования
венной меры их влияния. Закономерности, объяс
При статистическом исследовании финансо
няющие динамику показателя в прошлом, могут быть
во экономических показателей  в ходе анализа вы
использованы для прогнозирования его значений в
числяют простейшие характеристики динамики их
будущем, а учет случайности позволяет определить
развития, выявляют закономерности прошлого раз
вероятность отклонения от закономерного развития
вития и оценивают возможность их перенесения на
и их возможную величину.
будущее. Для успешного решения указанной задачи
Формирование уровней ряда определяется
необходимо:
закономерностями трех основных типов: инерцией
1. Иметь необходимый для проявления стати
тенденции, инерцией взаимосвязи между последо
стических закономерностей объем данных (для годо
вательными уровнями ряда и инерцией взаимосвязи
вых наблюдений   не менее 5 уровней, для сезонных
между исследуемым показателем и показателями
процессов   не менее трех периодов сезонности);
факторами, оказывающими на него причинное воз
2. Обеспечить методологическую сопостави
действие.  Соответственно, различают задачи анали
мость данных;
за и моделирования тенденций; взаимосвязи между
3. На основе содержательного анализа иссле
последовательными уровнями ряда; причинных
дуемого показателя обосновать возможность пере
взаимодействий между исследуемым показателем и
носа закономерностей прошлого на выбранный Вами
показателями факторами. Первая из них решается с
период прогнозирования;
помощью методов компонентного  анализа, вторая 
4. При помощи данной программы получить
с помощью адаптивных методов и моделей, а третья
адекватную математическую модель и на ее основе
  на основе эконометрического моделирования, ба
построить точечные и интервальные прогнозы.
зирующегося на методах корреляционно регрес
В случае невыполнения этапов (1 3) использо
сионного анализа.
вать математические методы бессмысленно!
Статистический анализ выполняется в сле
Основной формой представления статистиче
дующей последовательности:
ской информации являются временные ряды (ВР)
1. Постановка задачи и подбор исходной ин
наблюдений, т.е. ряды динамики, у которых в качест
формации.
ве признака упорядочения берется время. ВР, со
2. Предварительный анализ исходных времен
стоящий из N уровней  x(1), x(2), ... x(N), может
ных рядов и формирование набора              моделей
быть записан в компактной форме: X(t) t=1,2,...N,
прогнозирования.
т.е. t   порядковый номер наблюдения.
3. Численное оценивание параметров моде
Статистические методы исследования исходят
лей.
из  предположения  о возможности представления
4. Определение качества моделей (адекват
уровней ряда в виде суммы нескольких компонент,
ности и точности).
отражающих закономерность и случайность разви
5. Выбор одной лучшей или построение обоб
тия, в частности, в виде суммы нескольких компо
щенной модели.
нент:
6. Получение точечного и интервального про
Х(t) = f(t) + S(t) +E(t)
(1.1)
гнозов.
где f(t)   тренд (долговременная тенденция)
7. Содержательный комментарий полученного
развития;
прогноза.
S(t)   сезонная компонента;
На первом этапе формулируется цель иссле
E(t)   остаточная компонента.
дования, осуществляется содержательный  (логичес
Тренд представляет собой устойчивое изме
кий  и экономический)  анализ исследуемого процес
нение показателя в течение длительного времени. Он
са;  решается вопрос о выборе показателя, характе
выражается аналитической функцией, которая ис
ризующего его наиболее полно; определяются пока
пользуется для формирования прогнозных оценок.
затели, оказывающие влияние на ход развития; оп
Сезонная компонента характеризует устойчи
ределяется наиболее разумный период упреждения
вые внутригодичные колебания уровней. Она прояв
прогноза (горизонт прогнозирования, т.е. на сколько
ляется в некоторых показателях, которые представ
шагов вперед делается прогноз). Оптимальный го
лены квартальными или месячными данными. Нали
ризонт прогнозирования определяется индивиду
чие устойчивых колебаний в суточных или недельных
ально для  каждого  показателя на основе  содержа
данных  может  рассматриваться как циклическое и
тельного  суждения о его стабильности и с учетом
отображается сезонной компонентой.
статистической колеблемости данных. Он, как прави
Остаточная компонента представляет собой
ло, не превышает 1/3 объема данных.
расхождение между фактическими и расчетными

Предварительный анализ данных имеет це
ее адекватности и точности.  Адекватность  моделей
лью определение соответствия имеющихся данных
оценивается путем исследования свойств остаточной
требованиям, предъявляемым к ним математически
компоненты, т.е. расхождений, рассчитанных по мо
ми методами (объективности, сопоставимости, пол
дели уровней и фактических наблюдений. Точность
ноты, однородности и устойчивости); строится гра
модели характеризует степень близости расчетных
фик динамики, и рассчитываются основные динами
данных к фактическим. На основе характеристик точ
ческие характеристики (приросты, темпы роста, тем
ности и адекватности рассчитывается обобщенный
пы прироста, коэффициенты автокорреляции).
показатель качества модели, который используется
 Набор моделей (исходная база моделей )
для определения лучшей модели.
формируется на основе интуитивных приемов (таких,
В качестве прогнозной модели может быть вы
например, как анализ графика динамики ряда), фор
брана лучшая модель из числа построенных, либо на
мализованных статистических процедур
основе нескольких моделей сформирована  обоб
(исследование приростов уровней), исходя из целей
щенная модель  (см. “Построение обобщенного про
исследования и качества имеющейся информации, а
гноза”).
также содержательного  анализа. Предпочтение от
При выборе лучшей модели следует учитывать
дается  наиболее простым моделям, которые могут
не только формальные статистические характери
быть содержательно интерпретированы. При исполь
стики, но и интерпретируемость их траектории раз
зовании мощных ПЭВМ эту проблему можно перело
вития с содержательной точки зрения. В случае не
жить на программы, поручив провести вычисления по
совпадения результатов выбора по статистическому
всем доступным моделям и методам.
и содержательному критериям предпочтение отдает
Метод наименьших квадратов (МНК) лежит в
ся последнему.
основе численного оценивания параметров моде
На основе построенной модели рассчитыва
лей кривых роста. Параметры адаптивных методов
ются точечный и интервальный прогноз. Экстрапо
оцениваются с использованием специальных проце
ляция лежит в основе точечного прогноза. Он фор
дур многомерной численной оптимизации. Во всех
мируется путем подстановки в модель (уравнение
случаях основная идея оценки параметров заключа
тренда) соответствующего значения фактора
ется в наилучшем,  т.е. максимальном приближении
"Время", т.е.  t=N+1, N+2...N+k. Интервальные про
модели к исходным данным. Экстраполяционные
гнозы строятся на основе точечных.
методы прогнозирования  строят  модели кривых
Доверительная вероятность прогноза ха
роста и адаптивные модели,  которые используют
рактеризует степень уверенности в попадании про
лишь один фактор   "время". Этот фактор является
гнозируемой величины в построенный интервал про
условным представителем всей совокупности при
гнозирования. Она изменяется в пределах от 0 до
чинных факторов,  влияющих на интересующий нас
100%. и  задается пользователем. Следует помнить,
показатель. Кривые роста исходят из равноценности
что при ее увеличении интервальный прогноз расши
всех данных и отражают общую тенденцию развития,
ряется, и потому полезность прогноза обратно про
а адаптивные модели и методы исходят из большей
порциональна доверительной вероятности. Можно
значимости последних  наблюдений  и лучше отра
построить прогноз, который свершится с вероятно
жают динамику изменения. Потенциально более
стью 99%, однако с практической точки зрения он
мощным инструментом прогнозирования являются
будет бесполезен (например, прогноз погоды: ожи
модели Бокса Дженкинса и ОЛИМП. Поэтому именно
дается температура воздуха от 5 до 25 градусов    не
они составляют основу рабочей базы моделей. Каж
дает необходимой информации для принятия пра
дая построенная модель заносится в базу моделей.
вильного решения о форме одежды). С математиче
Максимальное количество моделей в базе моделей
ской точки зрения доверительной вероятностью для
ограничено 20 (в текущей версии). Если рабочая ба
расчета прогноза можно пользоваться лишь при по
за моделей заполнена (построено свыше двадцати
лучении адекватной математической модели.
моделей), то вновь построенная модель сравнивает
После получения прогнозных оценок необхо
ся с наихудшей моделью и вытесняет ее, если новая
димо убедиться в их разумности и непротиворечиво
модель имеет лучшие характеристики качества.
сти. Полученный прогноз должен быть подвергнут
Внутренняя информация базы моделей включает в
критическому рассмотрению с целью выявления
себя (для каждой модели):  тип модели;  количество и
возможных противоречий известным фактам и сло
значения параметров построенной модели;  вектор
жившимся к настоящему моменту представлениям о
остатков;  вектор прогнозов (включая границы) и ряд
характере развития на периоде упреждения прогно
других.
за. В качестве средства оценки эффективности ма
Информация, содержащаяся в рабочей базе
тематического аппарата при исследовании конкрет
моделей, служит основой для построения прогноза
ных процессов часто применяют ретропрогноз. При
как по лучшей модели, так и при формировании
наличии данных о динамике других показателей мож
обобщенного прогноза. Методика измерения качест
но построить модель их влияния на основной иссле
ва моделей в сочетании с высоким быстродействием
дуемый показатель и в случае ее высокого качества
современных вычислительных машин позволяет за
получить прогнозные оценки. Для формирования
короткое время просматривать большое количество
набора факторов кроме содержательных аспектов
моделей и оставлять из них наилучшие.
необходимо учитывать формально   статистические,
Качество модели с формально
которые основываются на коэффициентах корреля
статистической точки зрения оценивается на основе
ции. Следовательно, перед регрессионным анализом

необходимо воспользоваться корреляционным ана
Среднеквадратич.
24 n( n 1)2
лизом, а при необходимости получения прогнозов
отклонение:
S
=

E
 
еще и экстраполяционными моделями.
( n 3)( n 2)( n+3)( n+5)
2. Дескриптивная статистика
Коэффициенты асимметрии и эксцесса позво
Исходные данные могут быть охарактеризова
ляют сделать предварительные заключения о близо
ны простейшими средствами описательной стати
сти изучаемого распределения к нормальному. Рас
стики. Они позволяют получить представление об
пределение принято считать нормальным, если вы
особенностях исследуемого показателя и перспек
полняются условия:  ≤ 3S

S
    и     E
5SE  ,
тивности использования более глубоких методов
Коэффициенты вариации:
анализа.
• по размаху:
  R / x
Ниже приводятся формулы вычисления основ
• по среднему линей
lo / x
ных характеристик данных, в которых   x i    численные
ному отклонению:
значения наблюдений переменной  X, i=1,2,...,n.
• по среднеквадрати
σ / x
Среднее значение:
n
ческому отклоне
1
x  =  
∑ xi
нию:
n i 1
=
Медиана(исходный ряд
Xn/2
Среднеквадратиче
считается отсортирован
ское отклонение
ным)
(СКО):
Мода  -
Значение X, кото
Дисперсия:
n
рое наблюдается
σ 
1
2
 
( xi − x )
наиболее часто
n i 1
=
Минимальное значения
Xmin
Несмещенная
n
2
2
ряда
оценка дисперсии:
σ =
H
 
σ
n 1
Максимальное значение
Xmax
Среднеквадратиче
ряда
σ
2
H   =  
σ
ское отклонение
H
Размах
R = Xmax   Xmin
для несмещенной
Для изучения пространственных данных ис
оценки дисперсии:
пользуется технология их агрегирования путем по
Среднее линейное
n
строения интервального ряда. Ширина интервала
отклонение:
∑ xi − x
для группировки (Н) определяется следующим обра
lo 
i
=   =1
зом :
n
R
Моменты начальные:
H  =  
,   L =1+ 3.322 ⋅ lg(n) ,
2 го порядка:
L
1 n
  ν 2
2
  =  
∑ x
где L   количество интервалов (округляется в
n
i
i 1
=
большую сторону);
3 го порядка:
n
ν 
1
3
n   число членов ряда.
=  
∑ x
n
i
i 1
=
Если установлен соответствующий параметр,
4 го порядка:
то изменяется значение H и пересчитывается L. Каж
n
ν 4
1
=  
∑ x 4
дый й интервал (j = 1,...L) характеризуется опреде
n
i
i 1
=
ленной частотой и частостью  попадания в него соот
Моменты центральные:
ветствующих  наблюдений  заданного ряда.
3 го порядка:
n
µ 3 1
3
=

Таблица интервального ряда распределений
( x i − x )
n
содержит разбивку данных на интервалы, числовую
i 1
=
характеристику интервала (начало, середину и ко
4 го порядка:
n
µ 4 1
4
=
( xi − x )
нец), а также частоту и частость наблюдений.
n i 1
=
В качестве характеристик интервального ряда
Коэффициент
3
µ
используются:
асимметрии:
A
=
S
 
• 
σ 3
среднее значение
• дисперсия
Несмещенная
( n− )
1 n
• среднеквадратическое отклонение
оценка коэф.
A′ =  
A
S
S
• коэффициенты асимметрии и эксцесса
асимметрии:
n− 2
• мода и медиана
Среднеквадратическое
6 n( n 1)
отклонение (СКО) ко
S
=


Смысл и назначение этих характеристик сов
A
эффициента асиммет
( n 2)( n+1)( n+3)
падает с вариационными характеристиками, а фор
рии
мулы вычисления содержат компоненту, учитываю
Показатель экс
4
µ
щую частоту попадания наблюдений в интервалы.
цесса:
E  =   σ 4
Бутстреп оценки
Несмещенная
( n 1)
Сущность метода сводится к дополнению дан
  =  
[(nE
)
1
+6]
оценка:
( n 2)( n 3)
ных фактических наблюдений данными численного
моделирования. При этом моделирование произво

дится только в рамках фактических данных. Входные
средний темп роста
T
N
= −1
/ 1 100%
параметры метода:
r
Y
Y
N
{X , X ,..., X
средний  темп при
1
2
}     исходная выборка;
T
=
100%
роста
pr
Tr
k   количество моделируемых выборок (k>50);
где  N    число уровней ряда,
p   вероятностный уровень оценки математи
y i     уровни ряда.
ческого ожидания
Примечание.  Использование показателя средней
(рекомендуемые значения 0.7 0.9).
арифметической величины для характеристики процессов,
Решается задача оценки математического
представленных временными рядами с ярко выраженной
ожидания для малой выборки по следующему алго
тенденцией, является некорректным.
ритму:
1. Моделирование выборок  с использованием
Оценка наличия тренда
датчика натуральных чисел, равномерно распреде
Оценка наличия тренда в исследуемом вре
ленных в интервале  от 1 до n
менном ряду осуществляется при помощи методов




Фостера Стюарта и средних в соответствии с мето
v
=
j
X
, X
,..., X


дикой, которая изложена в работе Четыркина
N j
N j
N j
1
2
n




Е.М.[27]. В случае противоречивости их выводов
2. Для каждой выборки   ищется оценка ма
j
предпочтение отдается первому методу.
тематического ожидания:
В соответствии с методом проверки сущест
n
венности разности средних исходный временной ряд
  X

=
j
X
 ,  j
1,k
n
N
разбивается на две равные (или почти равные) части,
i
=1
после чего проверяется гипотеза о существенности
3. Для вариационного ряда математических
разности средних для этих частей. Недостаток мето
ожиданий выборки строится интервальный ряд, как
да состоит в невозможности правильно определить
описано в предыдущем разделе.
наличие тренда в том случае, когда временной ряд
4. С хвостов построенного интервального ряда
содержит точку изменения тенденции в районе сере
отсекаются интервалы таким образом, чтобы сум
дины ряда.
марная часть отброшенных интервалов не превосхо
В методе Форстера Стюарта гипотеза об от
дила (1 р). Оставшиеся интервалы определяют ин
сутствии тренда проверяется с помощью вспомога
тервальную оценку математического ожидания.
тельных функций:
3. Анализ временных рядов
T
  = ∑ lt ,
2
Характеристика динамики
l
=

t
Ut Vt
Динамика изменения исследуемого показате
1
е
, с ли
у <
,...,
ля может быть охарактеризована по отношению к
t
yt
y
1
1
=
t

какому то базисному (обычно первому) наблюдению
0
и величиной изменения соседних уровней. В этой
1 еcли
,
уt >yt
,... y
1 , 1
связи вычисляются базисные и цепные характери
v
=
t

стики. В качестве статистических характеристик вре
0
менного ряда  Y
Проверяется гипотеза о том, что L=0. Для про
i  ,  i = 1,N  используются следующие
верки строится t статистика:
величины:
L
τ
абсолютный базис
2
∆ b
=
,  где   σ
1/ ,
Y

L
L
t
ный прирост
i
i
Y1
σ L
=2
абсолютный цепной
∆ c
которая имеет распределение Стьюдента с T
Y

прирост
i
i
Yi 1
1 степенями свободы. Гипотеза об отсутствии тен
базисный коэффи
Kr =
i
Yi / Y1
денции отклоняется, если расчетное значение
циент роста
больше табличного на выбранном уровне значимости
цепной коэффици
c
Kr
Y /
0.95.
ент роста
i
i
Yi 1
базисный коэффи
b
Проверка однородности данных
Kp r
(Y 
) /
циент прироста
i
i
Y
Y
1
1
Проверка однородности данных обычно про
цепной коэффициент
c
Kp r
(Y 
) /
водится на основе критерия Ирвина, который осно
прироста
i
i
Yi
Y
1
1
ван на сравнении соседних значений ряда. В соот
темп роста
ветствии с ним рассчитывается характеристика  λ :
Tr
Kr b
=
100%

темп прироста

Tp r Tr 100%
λ
t Yt
=
1
t
σ
.
y
средняя  арифмети
N
1
ческая
=
∑ Y j
Полученные значения сравниваются затем с
N j=1
табличными значениями. Однако критерий Ирвина
средний абсолют
(Y 
) / (
недостаточно эффективен для выявления аномаль
1
− )
1
ный прирост
n
Y
N
ности в динамических рядах, потому что величина

σ
Динамика многих финансово экономических
 характеризует отклонения значений показателя
показателей имеет устойчивую колебательную со
от среднего уровня по всей совокупности наблюде
ставляющую. При исследовании месячных и квар
ний, а значит, он не ловит выбросы внутри ряда на
тальных данных часто наблюдаются внутригодичные
блюдений.  В программе используется модифициро
сезонные колебания соответственно с периодом 12 и
ванный метод, в соответствии с которым последова
4. При использовании дневных наблюдений часто
тельно рассчитываются  σ  не по всей совокупности,
наблюдаются колебания с недельным (пятидневным)
а по 3 4 наблюдениям, и рассчитанные с такими
циклом. В этом случае для получения более точных
скользящими значениями  σ
прогнозных оценок необходимо не только правильно
 величины сравнивают
отобразить тренд, но и колебательную компоненту.
ся  с  критическими значениями   λ для n=3.
Решение этой задачи возможно только при исполь
Проверка не производится для временных ря
зовании специального класса методов и моделей.
дов с периодом сезонности более единицы, а также
В основе сезонных моделей лежат их несезон
для уровней на концах периода наблюдения.
ные аналоги, которые дополнены средствами отра
Оценка автокорреляционных свойств
жения сезонных колебаний. Сезонные модели спо
собны отражать как относительно постоянную сезон
Оценка свойств сводится к исследованию ав
ную волну, так и динамически изменяющуюся в зави
токорреляционной и частной автокорреляционной
симости от тренда. Первая форма относится к классу
функции исходного и разностных рядов. Анализ авто
аддитивных, а вторая   к классу мультипликативных
корреляции выполняется с помощью графика и кри
моделей. Большинство моделей имеет обе эти фор
тических значений коэффициентов.
мы. Наиболее широко в практике используются мо
Автокорреляционная функция представляет
дели Хольта Уинтерса, авторегрессии, Бокса
собой совокупность коэффициентов автокорреля
Дженкинса.
ции, вычисленных для исследуемого показателя или
разностного ряда.
Кривые роста
Она используется для оценки тесноты взаимо
Для аналитического выравнивания временных
связи уровней ряда и подбора соответствующих ав
рядов используются функции с одним параметром t,
торегрессионных моделей. Анализ автокорреляции
представляющим собой порядковый номер наблю
выполняется с помощью графика автокорреляции;
дения (t=1,2,...N), который интерпретируется как
коэффициенты автокорреляции для его построения
"Время". Модели этого класса получили название
вычисляются по формуле:
"кривые роста". Оценка их параметров производится
аналогично построению парной регрессии, в которой
r
=
L
объясняющей переменной является время. Для кри
L
L
L
( N − L) Y Y +
вых роста реализованы те же вычислительные про
1  −   Y
Y
t
t
t
+L
=1
=1
=1
цедуры, что и в парной регрессии. Как показывает
L
L
L
L
практика, для целей краткосрочного и среднесрочно
[(N − L) ∑ Y 2 − Y )2 ] • [(N − L) ∑ Y 2 − Y
2
t
t
) ]
t 1
t
+
+1
го прогнозирования они являются надежным инстру
=1
=1
=1
=1
ментом.
  1 N
,  ,  L = 0,1,2,...
Метод наименьших квадратов является основ
Частная автокорреляционная функция
ным методом численной оценки параметров кривых
вычисляется по формуле:
роста. Оценка качества модели производится по кри
r ,
терию минимума средней квадратической ошибки.
 1
Аппроксимация наблюдений сложными функциями
k

1
 rk − ∑ ϕ
дает хорошее приближение к фактическим наблюде
ϕ
1, j rk − j
=
kk

=1
            k=2,3,...K

ниям, но снижает устойчивость модели на периоде
1

прогнозирования. Поэтому использовать для прогно
1− ∑ ϕ 1, j rj

зирования такие модели (например, полином выше
j

=1
второй степени) очень опасно. Особое место среди
где K   максимальная задержка (лаг) функции
18 задействованных в программе моделей занимают
(обычно K<=n/4);
две функции, которые не сводятся к модели линей
r   автокорреляционная функция (АКФ).
ной регрессии. Это функции   Гомперца и Логисти
“Чистые” авторегрессионые процессы имеют
ческая кривая. Для поиска их параметров использу
плавно затухающую АКФ и резко прерывающуюся
ется метод многомерной численной оптимизации (в
ЧАКФ. В этом случае в качестве порядка АР модели
настоящей версии программы   метод деформируе
выбирают лаг, после которого все ЧАКФ имеют не
мого многогранника).
значительную величину.
Экстраполяция траектории модели за период
4. Прогнозирование временных
наблюдения, т.е. подстановка в модель очередного
значения фактора "Время" t=N+1, N+2..., является
рядов
основой прогнозирования трендовых моделей. Ин
Для прогнозирования несезонных и сезонных
тервальный прогноз  в каждой прогнозной точке оп
процессов используется различный математический
ределяется по соотношениям регрессионного ана
аппарат.
лиза с заданной пользователем доверительной ве
роятностью.

Адаптивные методы прогнозирования
где  a
 и  a
   текущие оценки коэффициен
1 t
,
2 t
,
При краткосрочном прогнозировании обычно
тов адаптивного полинома.
более важна динамика развития исследуемого пока
В модели Брауна модификация (адаптация)
зателя на конце периода наблюдений, а не тенденция
коэффициентов линейной модели осуществляется
его развития, сложившаяся в среднем на всем пе
следующим образом:
риоде предыстории. Свойство динамичности разви
тия финансово экономических процессов часто пре
a
a
a
2
1
(
β e
)
1 t
,
1 t
,
1
− + 2 t
,
1
− +

t
обладает над свойством инерционности. Поэтому
более эффективными являются адаптивные методы,
a
a
2
1
(
β ) e
2 t
,
2 t
,
1
− +

t
учитывающие информационную неравнозначность
данных.
где  β  коэффициент дисконтирования дан
Адаптивные модели и методы имеют механизм
ных;
автоматической настройки на изменение исследуе
e
=

t
 ошибка прогнозирования,   e
1
мого показателя. Инструментом прогноза является
t
xt xt
модель (см. Базовые адаптивные модели), первона
Начальные значения параметров модели оп
чальная оценка параметров которой производится по
ределяются по МНК на основе нескольких первых
нескольким первым наблюдениям. На ее основе де
наблюдений. Оптимальное значение параметра дис
лается прогноз, который сравнивается с фактиче
контирования находится в переделах от нуля до еди
скими наблюдениями. Далее модель корректируется
ницы, определяется методом численной оптимиза
в соответствии с величиной ошибки прогноза и вновь
ции и является постоянным для всего периода на
используется для прогнозирования следующего
блюдений.
уровня, вплоть до исчерпания всех наблюдений. Та
Оператор В сдвигает всю последовательность
ким образом, модель постоянно "впитывает" новую
на один шаг назад:  Bx(t)=x(t 1). Применение опера
информацию, приспосабливается к ней и к концу пе
тора В к наблюдениям и к коэффициентам адаптив
риода наблюдения отображает тенденцию, сложив
ного полинома позволяет выразить модель Брауна в
шуюся на текущий момент. Прогноз получается как
виде:
экстраполяция  последней тенденции. В различных
(1
B)2 x
(1
2
2
2

=

β +
β )
t
B
B
et    ,
методах прогнозирования процесс настройки
из чего следует, что модель Брауна можно
(адаптации) модели осуществляется по разному.
трактовать как модель авторегрессии   скользящего
Базовыми адаптивными моделями являются:
среднего АРСС(p,d,q)  с p=0, d=2, q=2 и коэффи
Модель Брауна;
Модель Хольта;
циентами скользящего среднего       2 β  и  β .
Модель авторегрессии.
В таблице “Параметров модели” для модели
Первые две модели относятся к схеме сколь
Брауна отображается оптимальное значение коэф
зящего среднего, последняя   к схеме  авторегрес
фициента  β .
сии. Многочисленные адаптивные методы базируют
Модель Хольта
ся на этих моделях и различаются между собой спо
собом числовой оценки параметров, определения
В модели Хольта коэффициенты линейной мо
параметров адаптации и компоновкой.
дели
Согласно схеме скользящего среднего,
x
τ =
+
⋅τ
t ( )
a
a
оценкой текущего уровня является взвешенное
1 t
,
2 t
,
среднее всех предшествующих уровней, причем веса
модифицируются по следующим соотношени
при наблюдениях убывают по мере  удаления от по
ям:
следнего (текущего) уровня, т.е. информационная
a
a
a
+ α e
ценность наблюдений тем больше, чем ближе они к
1 t
,
1 t
,
1

2 t
,
1

1
t
концу периода наблюдений.
a
a
+ α e
Согласно схеме авторегрессии, оценкой те
2 t
,
2 t
,
1

2
t
кущего уровня является взвешенная сумма "p" пред
Начальные значения параметров модели нахо
шествующих уровней (их количество называется по
дятся по МНК на основе нескольких первых наблюде
рядком модели). Информационная ценность наблю
ний. Оптимальные значения параметров сглажива
дений определяется не их близостью к моделируе
ния  α и  α   находятся в переделах от нуля до еди
мому уровню, а теснотой связи между ними.
ницы. Они определяются методом многомерной чис
Обе эти схемы имеют механизм отображения
ленной оптимизации и являются постоянными для
колебательного (сезонного или циклического) разви
всего периода наблюдений.
тия исследуемого процесса.
Аналогично модели Брауна, модель Хольта в
Модель Брауна
терминах АРСС моделей представима в виде:
2
2
Пусть X(t), t=1,..,n   временной ряд наблюде
τ
(1 − B) x (1 − ( 2 − (α + α α (1 − α )
)
1
1
2
1
t
B
B
et
ний. Прогноз в момент времени t на 
 шагов вперед
 .Формулировка адаптивных моделей в терминах ли
может быть получен по формуле:
нейных параметрических моделей авторегрессии 
x
скользящего среднего позволяет трактовать их как
t (τ a
a
⋅τ
1 t
,
2 t
,
подмножество класса линейных параметрических

моделей. Таким образом, устанавливается соответ



( z
− = φ (
1
− )...−φ (
− +
ствие между двумя, вообще говоря, различными под
t
c
zt
c
1
p zt p
c
ходами к моделированию временных рядов.
+− θ
...
1
θ
t
at− − −
1
q at q
В таблице параметров модели для модели

λ
Хольта отображаются оптимальные значения коэф
где  z
( )
t
z
    значения предварительно
t
фициентов  αα
, 2 .
преобразованной переменной,
Модель Хольта Уинтерса
at  процесс "белого шума",
Модель для сезонных процессов существует
φ
φ
1,..., p  параметры авторегрессии,
в аддитивной форме и мультипликативной. Про
θ
θ
гноз на  τ  шагов вперед для аддитивной формы
1,..., q    параметры скользящего среднего.
строится по формуле:
Если использовать оператор сдвига назад B
=
x (τ a
a
⋅τ + g
Bz
−  ,
t
 ,
t
zt
1 t
,
2 t
,
s
1
то АРСС модель можно записать в оператор
а модификация параметров производится по
ной форме:
соотношениям:
( B

)

= θ
a
a
= α ( x − g
)
1
(
α ) (a
a
)
t
c
t
φ
1 t
,
1
t

+ −

s
1
1 t
,
1
− + 2 t
,
1

( B)
Параметры должны удовлетворять следующим
a
= α (a
− a
)
1
(
α ) a
2 t
,
3
1 t
,
1 t
,
1
− + −

3
2 t
,
1

условиям:
,
Для стационарности корни уравнения
где  g   фактор сезонности,
φ(B)  должны лежать вне единичного круга для
s   период сезонного цикла.
оператора авторегрессии  φ( B)  (ряды находятся в
Для несезонных временных рядов вычисли
статистическом равновесии относительно фиксиро
тельные формулы упрощаются за счет исключения
ванного среднего),
сезонной компоненты. При построении модели про
Для обеспечения обратимости корни уравне
изводится численная оптимизация  параметров
ния  θ( B)  должны лежать вне единичного круга
адаптации, значения которых изменяются от нуля до
для оператора скользящего среднего   θ( B) .
единицы.
Чтобы добиться экономии параметров, в мо
Модель авторегрессии
дель включают одновременно операторы авторег
В модели  авторегрессии AP(p) порядка "p"
рессии и скользящего среднего.
текущий уровень ряда представляется в виде взве
В то время как авторегрессионые модели и
шенной суммы "p" предыдущих наблюдений:
модели скользящего среднего были известны отно
X(t)= a *X(t 1)+a *X(t 2)+...+a(p)*X(t p)
сительно давно, их использование в моделировании
1
2
Параметры модели могут быть оценены по
временных рядов было затруднено по следующим
МНК (простая авторегрессия) или иным методом (как
причинам:
в методе Бокса Дженкинса). Порядок авторегрессии
отсутствие соответствующих методов иденти
(величина "p") определяется путем перебора, а его
фикации, оценивания и контроля этих моделей,
начальная оценка формируется на основе анализа
наличие неадекватных методов для описания
автокорреляционной функции. Лучшей считается
нестационарных рядов.
величина, при которой достигнута наименьшая дис
При формализации нестационарных рядов ис
персия ошибок.
пользуют такие классы моделей, которые пригодны
В сезонной модели авторегрессии AP(p) по
для представления широкого диапазона практиче
рядок выбирается равной периоду сезонности
ских ситуаций, т.е. используют конечные разности
(колебаний). Во многих случаях сезонная АР(р)   мо
порядка d:
дель с оценками по МНК оказывается "перегружен
d
=

∆ z
ной" незначимыми коэффициентами, и вследствие
t
t
этого она обычно уступает аналогичной модели Бок
 (Конечная разность первого порядка
са Дженкинса.
∆ ∗

z
= ∗ −
t
zt zt − ).
1
Для повышения устойчивости модели в боль
Стационарный ряд можно затем представить в
шинстве случаев целесообразно строить ее для ста
помощью АРСС модели
ционарного процесса, т.е. ряда с исключенной тен
( B)
денцией. В программе удаление тенденции осущест

= θ
t
c
at
φ
.
вляется на основе разностного оператора.
( B)
Определенная выше модель называется авто
Метод Бокса   Дженкинса
регрессионой интегрированной моделью скользяще
Если временной ряд стационарный, что озна
го среднего, или АРИСС(p,d,q). Взаимосвязанная
чает наличие статистического равновесия относи
статистическая методика, включающая в себя:
тельно постоянной средней с, он может быть пред
• идентификацию временного ряда (т.е. опре
ставлен широким классом линейных моделей, назы
деление размерностей операторов конечной разно
ваемых моделями авторегрессии скользящего сред
сти, авторегрессии и скользящего среднего),
него (АРСС). Это значит, что

• оценивание параметров модели,
сией   σ  , t=0,1,...,T, известны начальные значения
• 
e
проверку адекватности модели,
• 
y ,y
, ...,y . Тогда прогноз вида
получила название метода Бокса Дженкинса

  p+1   
1
p
по имени авторов.
E( y y
|
,...,y )
Φ
1
0
= − ∑
y
t

i
,
Сезонная модель Бокса Дженкинса содер
=1
жит сезонные операторы конечной разности, авто
где E   оператор математического ожидания,
регрессии и скользящего среднего. В операторном
будет иметь наименьшую дисперсию вне зависимо
виде она приобретает вид:
сти от значения корней характеристического уравне
D
*
ния.
 φ( B
S
S
)
θ
θ
S
 Φ( B ) Zt   =   (B)  (B ) Qt   ,
Сравнительные характеристики двух подходов
где  S   период сезонности,
к моделированию авторегрессионных процессов
  ∆D
приведены в таблице.
   оператор сезонной конечной разности,
Характеристики
Старая схема
Новая схема

=

S Zt
Zt Zt S
Тип моделируемых Стационарные
Стационарные и
 D   порядок сезонной конечной разности,
процессов
нестационарные
Φ    оператор сезонной авторегрессии поряд
Исходные предпо
Остатки независи
Остатки независи
сылки
мы и одинаково
мы, одинаково
ка P,
θ
распределены
распределены,
 оператор сезонного скользящего среднего
заданы начальные
порядка Q,
условия
d,  φ , Q   определены выше.
Базовое представ

t
= ∑δ
= ∑δ
+
Модель называется сезонной моделью авто
ление наблюдений
y
u
t
i
1
y
u
t
i
t
=0
=0
регрессии скользящего среднего (p,d,q)x(P,D,Q).
p
Основные этапы разработки сезонной модели такие
+ ∑ α y
j
i
же, как и для несезонной модели.
=1
Метод ОЛИМП
Ограничения
Корни характери
Нет ограничений
стического уравне
Метод ОЛИМП является распространением
ния вне единичного
моделей авторегрессии   скользящего среднего для
круга
моделирования нестационарных временных рядов.
Вид прогноза
E( y y
|
,...,y
=
t
p )
1
E(y y
|
,... y
1
=
t
t
, p)

Нами теоретически  доказано, что такое обобщение
p
p
корректно для широкого класса временных рядов.
= − ∑β y
i
t 1

= − ∑β y
i t 1
Формально соотношения модели ОЛИМП со
i 1
=
=1
ответствуют модели АРСС(p,q), за исключением то
го, что на вход модели поступает нестационарный,
Оказалось также, что статистические оценки
вообще говоря, временной ряд. Так же как и для не
модели являются состоятельными также вне зависи
сезонных моделей, сезонная модель ОЛИМП отлича
мости от значения корней характеристического урав
ется от АРСС моделей тем, что на ее вход могут по
нения. В практическом плане свойства состоятель
ступать нестационарные временные ряды, которые
ности оценок оказываются вполне достаточны для их
не приводятся к стационарным путем взятия конеч
использования.
ных разностей. В операторном виде модель ОЛИМП
Оценка качества моделей
(p,q)х(P,Q) имеет вид:
Качество модели оценивается, как правило,
φ
*
( B) Φ BS
= θ( ) θ( S
  (
) Z
)
.
t
B
B
 Qt
двумя дополняющими друг друга характеристиками:
С точки зрения общих соображений размер
точностью и адекватностью. Каждая из них, в свою
ности операторов авторегрессии для модели ОЛИМП
очередь, имеет несколько критериев. Они с разных
должны быть несколько больше, чем для модели
сторон и не всегда однозначно характеризуют иссле
Бокса Дженкинса при моделировании одинаковых
дуемый процесс. Поэтому существует необходи
временных рядов.
мость в их интегрированной оценке. На основе от
Если идентифицирована модель Бокса
дельных критериев точности и адекватности, рас
Дженкинса с параметрами p,d,q, то соответствую
смотренных ниже, формируется обобщенный крите
щая модель ОЛИМП должна иметь параметры:
рий.
p’=p+d, q’=q.
Схема формирования интегрированных крите
В работе [3, 4], доказано следующее утвер
риев точности и адекватности, а также общего крите
ждение. Пусть процесс  удовлетворяет стохастиче
рия качества прогнозирования состоит в следующем.
t
скому разностному уравнению порядка p
С помощью механизма параметров пакета формиру
(авторегрессионый процесс)
ется состав отдельных критериев, на основе которых
p
рассчитывается интегрированный показатель. Так,
∑Φ
=
i y t i
ut ,
точность может характеризоваться только коэффи
=0
циентом детерминации, или дисперсией и средней
где  Φ    коэффициенты оператора авторег
ошибкой аппроксимации, или всеми тремя перечис
рессии,
ленными выше критериями точности.
U     последовательность независимых одина
Предварительно для каждого отдельного кри
t
ково распределенных случайных величин с диспер
терия разрабатывается процедура его нормировки.

Нормированный критерий получается из исходной
циентов асимметрии и эксцесса, которые приведены
статистики критерия таким образом, чтобы выполня
в разделе дескриптивных статистик.
лись условия:
При оценке адекватности уравнения регрес
• нормированный критерий равен 100, если
сии учитывается также корреляционное отношение,
модель абсолютно точная (адекватная),
которое характеризует долю дисперсии зависимой
• нормированный критерий равен 0, если мо
переменной, объясняемой уравнением регрессии.
дель абсолютно неточная (неадекватная).
Корреляционное отношение рассчитывается по
Проблема нормирования решается специаль
формуле:
ным образом для каждого из критериев качества мо
n
n
2
2
,
дели прогнозирования. Числовое значение каждого
η =   1 ( (yi − y ) ) /(
i
(yi y ) )
i
показателя лежит в диапазоне от 0 до 100. То же са
i=1
i=1
мое относится к интегрированному критерию адек
где  yi     расчетные  значения зависимой пе
ватности.
ременной,
Обобщенный критерий качества модели фор
мируется как взвешенная сумма обобщенного крите
yi    среднее значение.
рия точности и обобщенного критерия адекватности.
Точность модели
Веса этих слагаемых составляют соответственно 0.75
и 0.25, т.е. точностным характеристикам придается
Точность модели характеризует близость рас
больший вес. В качестве представителя характери
четных наблюдений к фактическим на периоде ап
стик точности используется нормированное значе
проксимации. Считается, что модели с меньшим рас
ние средней относительной ошибки аппроксимации,
хождением между фактическими и расчетными зна
а в качестве представителя критериев адекватности 
чениями лучше отражают исследуемый процесс. Для
нормированное значение критерия Дарбина Уотсона
характеристики степени близости используются:
и характеристики нормального закона распределе
• среднее квадратическое отклонение (или
ния остаточной компоненты. Числовое значение
дисперсия), учитывающее сложность модели;
обобщенного критерия качества лежит в диапазоне
• коэффициент детерминации (чем ближе к 1,
от 0 до 100. Минимальное значение соответствует
тем более точная модель);
абсолютно плохой модели, а максимальное   идеаль
• средняя относительная ошибка аппроксима
но отображающей развитие показателя. Обобщен
ции (чем ближе к 0, тем точнее модель);
ный критерий качества модели сформирован в соот
• среднее значение (должно быть близко к ну
ветствии со схемой формирования интегрированных
лю);
критериев. Наш опыт применения этого показателя
• максимальное отклонение.
показывает, что достаточно надежными являются
Статистически точность прогнозов можно
модели, имеющие оценку качества не менее 75.
оценить только используя ретропрогноз, суть его
Формально статистический выбор лучшей мо
состоит в построении модели по усеченному объему
дели во многих случаях не дает полной уверенности в
данных (N k) точек с последующим сравнением про
его правильности. Поэтому кроме указанной про
гнозных оценок с известными (фактическими), но
граммой модели целесообразно просмотреть ре
умышленно “забытыми”  k уровнями ряда. По резуль
зультаты прогнозирования других моделей, имею
татам сравнения  вычисляются следующие показате
щих близкое значение критерия качества.
ли точности:
• среднее значение;
Адекватность моделей
• среднеквадратическое отклонение;
 АДЕКВАТНЫМИ моделями  считаются такие, у
• средний модуль ошибок прогнозирования
которых остаточная компонента имеет свойства не
(%);
зависимости, случайности и нормальности распре
• максимальное и минимальное отклонение.
деления.
Чем меньше значение этих величин, тем выше
Критерий Дарбина Уотсона является наибо
качество ретропрогноза. Этот подход дает хорошие
лее распространенным критерием для проверки кор
результаты, если на периоде ретропрогноза не со
реляции внутри ряда. Если величина
держится принципиально новых закономерностей.
n
(e − e
2
Построение обобщенного прогноза
i
− )
1
D
i
= =2
 ,
На практике, часто встречается ситуация, ко
n
∑ e2
гда среди построенных моделей несколько оказались
i
=1
адекватными, а различия между их характеристиками
где  e
точности невелики. В этом случае целесообразно
   расхождение между фактическими и
расчетными уровнями, имеет значение, близкое к 2,
строить обобщенный прогноз. В программе он фор
то можно считать модель регрессии достаточно аде
мируется как линейная комбинация частных прогно
кватной.
зов:
M
Для построения интервального прогноза необ
$
y
= ∑ p y
0
j
,
ходимо выполнение свойства нормальности распре
j 1
=
деления остаточной компоненты. Оценка выполнения
где  M   число объединяемых прогнозов;
этого свойства осуществляется на основе коэффи

p
2
j
 весовые коэффициенты частных прогно
σ + − − k
 M
ij
iM
jM

=
=
i
j
зов;
b
b
ij
ji

                  
σ − 2k
M
+ σ
j
y
M
jM
j


j
 частные прогнозы.
Вектор свободных членов будет состоять из
Весовые коэффициенты определяются из ус
элементов:
ловия минимума дисперсии ошибок обобщающего
прогноза   т.е. максимума его точности, которая на
= σ − k
j
M
jM  .
ходится как сумма всех элементов ковариационной
Такая система уравнений может быть решена
матрицы ошибок частных прогнозов с соответствую
одним из методов линейной алгебры.
щими весами:
Алгоритм объединения частных прогнозов
M M
σ = ∑ ∑
можно представить в виде следующих последова
0
k p p
ij
i
 ,
тельно выполняемых процедур:
i 1
j 1
=
1. Вычисляются дисперсии ошибок частных
k
= σ σ r
ij
i
j ij ,
прогнозов и строится ковариационная матрица
где  k
n
ij
 корреляционный момент, характери
σ 2 1
2
=

=
j
e
        j
1 M
,
зующий совместное распределение ошибок
n
jt
t 1
=
i и j  частных прогнозов;
где   e j    ошибки частных прогнозов
σ σ
,
j
 средние квадратичные ошибки;
    порядковый номер наблюдения ( 1,n )
rij    коэффициент корреляции между рядами
n

ошибок частных прогнозов  y
k
e e
ij
 и  y j .
n
it
jt
=1
На весовые коэффициенты накладывается ог
2. Строятся матрица В и вектор С по форму
раничение: их сумма должна давать единицу. Это
лам:
необходимое условие того, чтобы дисперсия обоб
= σ − k
− k
щающего прогноза не превышала дисперсии частных
ij
ji
M
ij
iM
jM
прогнозов. Тогда ковариационная матрица ошибок
= σ − k
j
M
jM
частных прогнозов будет иметь вид:
3. Из решения системы линейных уравнений
 σ 2 k
...
k

1
12
M

1

определяется (М 1) значение p j , а последний весо
k
2
21
σ
... k

2
2

k
M
= 

вой коэффициент  p
 ...
...
...
... 
определяется по формуле:
k
k

2
1
2
...
σ

M
M

1
Дисперсия обобщающего прогноза будет рав
p
=1− ∑ p
M
j
на сумме всех элементов матрицы:
=1
M 1



4. Проверка условия:
σ 2 2


1
1
p
12
k
1
p p2
...
1
k M 1
p 1
(
∑ p j ) 
j 1

=

  >
=
j
     j
1 M
,
M 1


2
2

k


Если условие не выполняется, прогнозы
21 1
p p2
σ 2p2
... k2 p
M
2 1
(
∑ pj )
j 1

=

...
...
...
...


исключаются и производится перерасчет весовых
j
M 1

M 1

M 1


2

k



1
M
1
p 1
(
∑ p ) k
j
M 2 p2 1
(
∑ p j ) ...
σ
1
(
∑ p
M
j )


коэффициентов (к пункту 2).
j 1
=
j 1
=
j 1

=

5. Если все весовые коэффициенты положи
В точке минимума функции  σ 2
тельны, вычисляется значение обобщающего про
0 ( p ) все (М 1) первые
гноза:
частные производные должны обращаться в нуль.
M
Приравняв к нулю все (М 1) первые частные
y
= ∑ p y
0
j
j
производные по переменным  p , p ,..., p
=
1
2
M 1
−  полу
j 1
чаем систему (М 1) линейных уравнений с (М 1) не
и коэффициент условной эффективности:
известными:
2
σ
u
0
=
y1 / y
2
0
σ1

2
p
2
(σ
− 2k
2
+ σ
+
где  σ
   дисперсия ошибок комплексного
1
)
1
M
1
M

0
M 1


прогноза;
+
 ∑ p (k − k
− k
2
2
+ σ = σ
− k
i
i1
M
1
iM
M
M
M
1

σ 2
=2
 дисперсия ошибок наилучшего частного

1
p
2
(
− σ
− 2k
2
+ σ
+
прогноза.
M 1
)
M 1
( M 1)M


M

Так как в большинстве случаев точность про
2
+ ∑ p (k − − 
− k
2
2
+ σ = σ
− k
i
i( M 1)
( M 1)M
iM
гнозов изменяется во времени, формулы оценки ве
M
M
( M 1
− )M

 i 1
=
совых коэффициентов модифицируются так, что бо
Коэффициенты при переменных составят матрицу В,
лее поздним ошибкам присваивается большее зна
элементы которой определяются следующим обра
чение; таким образом происходит корректировка
зом:
обобщающего прогноза путем изменения весовых

коэффициентов в сторону наилучшего частного про
При этих же предпосылках для проверки гипо
гноза:
тезы о равенстве нулю парного коэффициента кор
M
реляции используется t статистика, распределенная
y
= ∑ p y
0T
jT
jT
по закону Стьюдента с n 2 степенями свободы. В
j 1
=
программе для парного коэффициента  корреляции
где  p jT  весовой коэффициент частного про
сначала рассчитывается критическое значение t
гноза в момент времени Т;
статистики,, а на его основе критическое значение
y
коэффициента корреляции
jT
 частный прогноз в момент времени Т;
t
y
kp
T
0
   обобщенный прогноз в момент времени
r
=
kp
2
Т.
n− t
Для повышения стабильности динамики изме
Если расчетное значение больше критическо
нения весов в алгоритме их корректировки использу
го, то гипотеза о равенстве нулю данного коэффици
ется схема экспоненциального сглаживания.
ента корреляции отвергается на соответствующем
Для проведения обобщения необходимо
вероятностном уровне. Аналогичные выводы имеют
иметь не менее двух адекватных моделей. В целях
место при проверке значимости частных коэффици
повышения устойчивости результатов количество
ентов корреляции.
обобщаемых частных прогнозов не должно превы
шать пяти.
Частные коэффициенты корреляции
 Частный коэффициент корреляции первого
5. Корреляционный анализ
порядка между k м и L м факторами  характеризует
Основными задачами корреляционного ана
тесноту их линейной связи при фиксированном  зна
лиза являются:
чении  го  фактора.  Он определяется как
• измерение степени связи двух или более яв
rk − 
L
kj
rLj
r
  =  
лений;
kL⋅ j
2
2
• 
(1− r
) (1
)
отбор факторов, оказывающих наиболее су
kj
rLj
щественное влияние на результативный признак на
Он распределен аналогично парному коэффи
основании измерения степени  связности между яв
циенту при тех же предпосылках, и для проверки его
лениями;
значимости используется статистика, в которой
• обнаружение ранее неизвестных причинных
число степеней   свободы равно n 3. В программе
связей. Корреляция непосредственно не выявляет
частный коэффициент корреляции рассчитывается  в
причинных связей между явлениями, но устанавли
общем виде, т.е. при условии, что все остальные пе
вает численное значение этих связей и достовер
ременные   фиксированные:
ность суждений об их наличии.
DkL
При проведении корреляционного анализа вся
rkL  (частн.) =  D
совокупность данных рассматривается как множест
kk DLL
во переменных (факторов), каждая из которых со
Здесь  Dij    определитель матрицы, образо
держит n наблюдений;  x ik    наблюдение i перемен
ванной из матрицы парных коэффициентов корреля
ной k;  x k    среднее значение k ой переменной;
ции вычеркиванием й строки и  го столбца. Для
i=1,...,n.
каждого частного коэффициента корреляции  анало
Основными средствами анализа являются:
гично парному рассчитывается t значение для про
• парные коэффициенты корреляции;
верки значимости коэффициента, а также довери
• частные коэффициенты корреляции;
тельные интервалы. При этом дисперсия z
• множественные коэффициенты корреляции.
преобразованной величины будет равна 1/(n L 3),
Парные коэффициенты корреляции опосредо
где  число фиксированных переменных (в про
ванно учитывают влияние других факторов. Для ис
грамме L=m 2).
ключения этого влияния определяют частные коэф
Множественные коэффициенты кор
фициенты корреляции.
реляции
Для определения тесноты связи между теку
Парные коэффициенты корреляции
щей k й переменной и оставшимися
Парный коэффициент корреляции между м и
(объясняющими) переменными, используется выбо
м факторами вычисляется по формуле:
рочный множественный коэффициент корреляции:
n
D
( xik − xk )( xi − x
R   =   1  
,
L
L )
k
D
r
i
=
=1
kk
kL
n
n
где  D   определитель матрицы парных коэф
∑ ( x
2
2
ik − x k )
( xi − x
L
L )
фициентов корреляции.
=1
=1
Для проверки статистической значимости ко
Он служит показателем тесноты линейной ста
эффициента множественной корреляции использу
тистической связи, но только в случае совместной
ется величина:
нормальной распределенности случайных величин,
выборками которых являются й и L й факторы.

β
R2 / L
   подлежащий определению вектор пара
F  =  
,
метров,
− R2
1
) / ( n − − 2)
ε     вектор случайных отклонений.
имеющая F  распределение с L и (n L 2) сте
В регрессионном анализе действуют следую
пенями свободы соответственно.
щие предположения:
Если рассчитанное значение больше значе
    M[ε ,    M[ε ⋅ ε 0 ,     j ≠ ,
ния распределения на соответствующем вероятно
i
i
j
стном уровне (0.9 и выше), то гипотеза о линейной
M[ε ⋅ ε = σ 2
e ,    j =1,m
i
i
связи между k й переменной и остальными перемен
матрица X детерминирована и ее столбцы ли
ными не отвергается. В программе для каждого ко
нейно независимы.
эффициента множественной корреляции выводится
МНК оценки находятся из условия минимума
значение и процентная точка распределения,
функционала:
которая ему соответствует.
(Y
Xβ )T

(Y − Xβ )
6. Регрессионный анализ
Оценки параметров имеют вид:
В регрессионном анализе решаются следую
β =
T

( X X ) 1 X TY
щие задачи:
• 
и являются несмещенными и эффективными.
установление форм зависимости
(положительная, отрицательная, линейная, нелиней
Пусть  ⋅ β     эмпирическая аппроксими
ная);
рующая регрессия. Тогда элементы вектора
• определение функции регрессии. Важно не
− Y
только указать общую тенденцию изменения зависи
называются остатками. Анализ остатков по
мой переменной, но и выяснить, каково было бы дей
зволяет судить о качестве построенного уравнения
ствие на зависимую переменную  главных  факторов 
регрессии.
причин, если бы прочие (второстепенные, побочные)
факторы не  изменялись бы (находились бы на одном
Пошаговая регрессия
и том же  среднем  уровне), и если были бы исключе
Пошаговая регрессия является одним из ме
ны случайные элементы;
тодов определения наилучшего подмножества рег
• оценка неизвестных значений зависимой пе
рессоров для объяснения Y. Реализуется пошаговая
ременной.
процедура с последовательным включением пере
Уравнение множественной линейной регрес
менных  в уравнение регрессии.
сии имеет вид:
Пусть в уравнение регрессии включено пе
a0 a x
1 1 +.. +
. a
x
m
m
ременных, т.е. сделано L шагов алгоритма, и осуще
В каждом виде регрессионного анализа необ
ствляется L+1 шаг. Основной вопрос, который реша
ходимо выбрать зависимую переменную Y (для кото
ется на каждой итерации   это вопрос о том, какую
рой строится уравнение регрессии) и одну или не
переменную включать в уравнение регрессии.
Для каждой переменной регрессии, за исклю
сколько независимых переменных  x i  (i=1,2,...m).
чением тех переменных, которые уже включены в
Это уравнение позволяет установить статистическую
модель, рассчитывается величина  C j , равная отно
взаимосвязь изучаемых показателей и, в случае ее
устойчивости, давать аналитические и прогнозные
сительному уменьшению суммы квадратов зависи
оценки.
мой переменной. При включении переменной в урав
На базовом периоде времени строится урав
нение регрессии она интерпретируется как доля ос
нение  регрессии зависимой переменной. Далее
тавшейся дисперсии независимой переменной, ко
производится расчет прогнозных значений зависи
торую объясняет j я переменная. Пусть k   номер
мой переменной по рассчитанному уравнению рег
переменной, имеющей максимальное значение j го
рессии. При этом для всех регрессоров заранее
элемента. Тогда если  Ck <p, где p   заранее опреде
должны быть получены их прогнозные оценки и допи
ленная константа, то анализ переменных прекраща
саны в конец исходных данных. Для зависимой пере
ется, и больше переменных не вводится в модель. В
менной в таблицу исходных данных на глубину пе
противном случае я переменная вводится в урав
риода прогнозирования необходимо дописать нуле
нение регрессии. Константа p является параметром
вые значения.
метода и может быть изменена пользователем.
Линейная множественная регрессия
Гребневая регрессия
В линейном регрессионном анализе рассмат
Гребневая регрессия основана на гребневых
ривается зависимость случайной величины Y от ряда
оценках, направленных на оценивание множествен
исходных факторов (регрессоров)  X , X ,..., X
1
2
,
ных линейных регрессий в условиях мультиколлине
которая в силу влияния неучтенных факторов будет
арности, т.е. сильной корреляции независимых пе
стохастической. В матричной записи она имеет вид:
ременных. Как известно, следствием мультиколли
Xβ + ε
неарности является плохая обусловленность матри
цы X'X и бесконечное  возрастание по этой причине
где Y   вектор значений переменной,
дисперсии оценок линейной регрессии.
X   матрица независимых переменных,

Матрица X'X регуляризуется путем добавле
Парная регрессия
ния малого положительного числа к диагональным
Парная регрессия устанавливает связь между
элементам. В программе реализован алгоритм по
откликом Y и функцией, зависящей от одной входной
строения однопараметрической гребневой оценки
переменной X, т.е. регрессия имеет вид: Y = f(X).
вида:
Функции f, включенные в парную регрессию в на
a(k) = (X'X +kD) X'Y,   k  >= 0 ,
стоящем  пакете, удовлетворяют двум основным ус
где k   параметр регуляризации;
ловиям: они распространены в практике экономиче
D   матрица регуляризации, в качестве кото
ских исследований, каждое из уравнений регрессии
рой может быть выбрана единичная матрица или
путем преобразований типа логарифмирования и
диагональная матрица, составленная из диагональ
возведения в степень сводится к линейной модели.
ных элементов матрицы  X'X.
Для реализации функции парной регрессии
Для автоматического расчета параметра вы
необходимо выбрать переменную Y (зависимая пе
брана формула
ременная), переменную (объясняющая перемен
k=ms/a'a,
ная), а также сформировать список функций парной
где      вектор оценок регрессии по  МНК,
регрессии.
s     оценка остаточной дисперсии по МНК.
Основные функции парной регрессии и соот
Тем не менее, пользователь имеет возмож
ветствующие преобразования приведены в таблице:
ность произвольно изменять значения параметра
регуляризации.
Модель
Преобразование
Матрицы
X
Y
Y=a+bX
нет
1

1
x


..
.





n
xn 
Y = a+bX+cXX
нет
1 x
x 2 
1
1


 .
.



n
x
x 2

n

Y = a+b/X
нет
 1 1
      /

1
x


2
1
      / x


 .  .  .  . 



1
n      / x 
n
Y = 1/(a+bX)
возведение в
 1



1
   x
1/ y1
степень( 1)




2   x


1/ y


 .  .  . 




.  .  .


 n   x 


n
1/ y n
Y = 1/(a+b*exp( X))
возведение в
 1   
(
exp



1
x )
1/ y1
 степень ( 1)




2   
(
exp x

2 )
1/ y



  .
.   .  .





.  .  .


 n   
(
exp
x )


n
1/ y n
Y=a*exp(bX)
логарифми
 1



1
   x
ln( y )
1
рование




2   x


ln( y )


 .  .  . 




.  .  .


 n   x 


n
ln( y )
n
Y=a+b*lg(X)
нет
 1   (
ln

1
x )


2  
(
ln x

2 )
 .  .  .  . 


 n   (
ln x )
n
2
Y=a* b x c x2
логарифми
       x
1
  x   
 ln( y )
1
рование
1
1




 2  x   x 2 
ln( y )


2
2
2




.  .  .  


.  .  .





  x 2
n  x

 ln(y )
n
n
n

Модель
Преобразование
Матрицы
X
Y
Y=a b x
логарифми
 1



1
   x
ln( y )
1
рование




2   x


ln( y )


 .  .  . 




.  .  .


 n   x 


n
ln( y )
n
Y = a+b/ln(X)
нет
 1 1
     /
(
ln

1
x )


2
1
     /
(
ln x

2 )

.  .  .  .




1
n     /
(
ln x )
n
Y=a X b
логарифми
 1   (
ln



1
x )
ln( y )
1
рование




2  
(
ln x

2 )
ln( y )


 .  .  .  . 




.  .  .


 n   (
ln x )


n
ln( y )
n
bX c X
нет
 1

1
  x   
1
x


 2  x

2   
x 2


.  .  .  .




n  x    x

n

Y = X/(a+bX)
нет
 1



1
   x
x / y


1
1


2   x


x
/ y
 2

 .  .  . 




.  .  .  


 n   x 


n
x / y
n
n
Y=a*exp(b/X)
логарифми
 1 1
   /



1
x
ln( y )
1
рование




2 1
   / x


ln( y )


 .  .  .  . 




.  .  .


 1
n   / x 


n
ln( y )
n
k
k


+
нет
bX
        x
1
  
1


 2    xk 
2


.  .  .  



k


n    x n 
y
a
bX
cXX .. dX k
= +
+
+ +
нет
     x
1
   . . x k   
1
1


 2  x   . . x k 
2
2


.  .  .  ..  .  .





  . . x k
n  x

n
n
Для каждой функции из списка будут  найдены
симую переменную из за различий единиц измере
оценки  регрессии по методу наименьших квадратов,
ния и степени колеблемости. Для устранения этого
а также рассчитан критерий. Критерием является
применяется:
величина:
• коэффициент эластичности;
n
• дельта коэффициент;
1
,
( y
y )
• 
n


k
i
i
бета коэффициент.
i 1
=
Как с помощью частных коэффициентов эла
где k   число оцениваемых параметров функ
стичности, так и с помощью бета коэффициентов
ции.
можно проранжировать факторы по степени их влия
Та функция, которой соответствует минималь
ния на зависимую переменную, т.е. сопоставить их
ное значение критерия, считается оптимальной. Для
между собой по величине этого влияния. Вместе с
нее рассчитываются все параметры и результаты
тем нельзя непосредственно оценить долю влияния
выводятся в протокол “Регрессионный анализ”.
фактора в суммарном влиянии всех факторов. Для
Экономическая интерпретация результатов
этой цели используют дельта коэффициенты.
С помощью коэффициентов регрессии нельзя
Коэффициент эластичности
сопоставить факторы по степени их влияния на зави

¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Для экономической интерпретации нелиней
R2    коэффициент множественной детерми
ных связей обычно пользуются коэффициентом эла
нации,
стичности, который характеризует относительное
r
изменение зависимой переменной при изменении
i
 коэффициент парной корреляции между i
объясняющей переменной на 1%. Если уравнение
м фактором и зависимой переменной,
регрессии имеет вид y = f(x), то коэффициент эла
β CT
i
     β коэффициент.
стичности рассчитывается как
При корректно проводимом анализе величины
Э
df
x
=
*
дельта коэффициентов положительны, т.е. все ко
dx
y
эффициенты регрессии имеют тот же знак, что и со
где     среднее значение переменной x,
ответствующие парные коэффициенты корреляции.
   среднее значение переменной y.
Тем не менее, в случаях сильной коррелиро
ванности объясняющих переменных, некоторые
Производная берется в точке  .
дельта коэффициенты могут быть отрицательными
Аналитические выражения для расчета коэф
вследствие того, что соответствующий коэффициент
фициента эластичности с точностью до знака приве
регрессии имеет знак, противоположный парному
дены в таблице :
коэффициенту корреляции.
N
Функция
Формула коэффициен
та эластичности
Бета коэффициент
1
y = a+bx
x
Э =  b
Для устранения различий в измерении и сте
y
пени колеблемости факторов используется   коэф
 
2
x
y = a+bx+c x 2
Э =  ( b 2cx )
фициент, или коэффициент регрессии в стандарти
y
зованном виде:
3
y = a+b/x
Э =  b / ( ax b)
S
β CT
j
b
4
y = 1/(a+bx)
Э =  b x / ( a b x )
j
j Sy
5

  ,
y = 1/(a+b e x )
Э =
− x
x
где   b
bxe
+

/ (
be
)
   коэффициент регрессии при й пе
6
ременной,
y =  a ebx
Э = bx
S j    оценка среднеквадратического отклоне
7
y = a+bln(x)
Э = b/y
ния j й переменной,
8
2
Э=
y =  a b x c x
S
2
   оценка среднеквадратического отклоне
a(ln( b e x
)
c x
+
ния независимой переменной.
Он показывает, на какую часть величины сред
x
x 2
x
+2b xe
ln( c))
него квадратического отклонения меняется среднее
y
значение зависимой переменной с изменением со
9
y =  ab x
Э =  ⋅ ln( b e x x
)
ответствующей независимой переменной на одно
y
среднеквадратическое отклонение при фиксирован
10
y = a+b/ln(x)
ном на постоянном уровне значении остальных неза
Э =  b / (ln2 ( x ) ⋅ y )
висимых переменных.
11
y =  ax b
Э = b
12
7. Факторный и компонентный
y = a+bx+c
x
x
Э = (b c/
y
анализ
13
y = x/(a+bx)
Э = a/(a+bx)
Компонентный анализ является методом оп
14
ределения структурной зависимости между случай
y =  ae( b / x )
Э = b/x
ными переменными. В результате его использования
15
y = a+ bx k
Э =  b k x k
b x k
/ (
)
получается сжатое описание малого объема, несу
16
y =
k
щее почти всю информацию, содержащуюся в ис
Э =  ∑ a i x i ) / y
i
a
a x1
+
+.. +
. a x k
ходных данных. Главные компоненты  Y Y
,
,... Y
,
0
1
k
=1
1
2
m
получаются из исходных переменных
X , X
,..., X
1
2
 путем целенаправленного враще
Дельта коэффициент
ния, т.е. как линейные комбинации исходных пере
Доля вклада каждого фактора в суммарное
менных. Вращение производится таким образом,
влияние всех факторов равна:
чтобы главные компоненты были ортогональны и
r
имели максимальную дисперсию среди возможных
⋅β j
∆ =
линейных комбинаций исходных переменных X. При
,  ∑ ∆ =
j
k 1
R2
этом переменные  Y Y
,
,... Y
,
 не коррелированны
k
1
2
m
между собой и упорядочены по убыванию дисперсии
R2 β + β +.. +
. r β
1
1
2
2
k k
(первая компонента имеет наибольшую дисперсию).
Кроме того, общая дисперсия после преобразования
15

¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
остается без изменений. Итак, i я главная компонен
На следующей итерации модифицируется
та :
матрица R   вместо элементов главной диагонали
i
m
m
подставляются оценки общностей, полученные на
2
Y
=
∑ α
  ,    
α
=
i
x
1   ,     i = 1 , m
i   j
j
i   j  
предыдущей итерации; на основании модифициро
1
j = 1
ванной матрицы R с помощью вычислительной схемы
Пусть R   корреляционная матрица перемен
компонентного анализа повторяется расчет главных
ных X. Тогда  α
   первый собственный вектор
компонент (которые не являются таковыми с точки
1 j
зрения компонентного анализа), ищутся оценки
матрицы R, и т.д. Кроме того, дисперсия первой
главных факторов, факторных нагрузок, общностей,
главной компоненты равна первому собственному
специфичностей.  Факторный анализ можно считать
числу матрицы R, дисперсия второй главной компо
законченным, когда на двух соседних итерациях
ненты равна второму собственному числу матрицы R,
оценки общностей меняются слабо.
и т.д.
Примечание. Преобразования матрицы R мо
Факторный анализ является более общим
гут нарушать положительную определенность матри
методом преобразования исходных переменных по
цы R и, как следствие, некоторые собственные зна
сравнению с компонентным анализом. Модель фак
чения могут быть отрицательными.
торного анализа имеет вид:
Для лучшей интерпретации полученных общих
p
факторов к ним применяется процедура варимаксно
X
=

λ
+
i
F
  ,
i   j
j
e i
1
го вращения.
Если факторный анализ ведется в терминах
где λ ij    постоянные величины, называемые
главных компонент, то значения факторов могут быть
факторными  нагрузками,
вычислены непосредственно. Главные компоненты
F
(без вращения) могут быть представлены в виде:
   общие факторы, используемые для
представления всех p исходных  переменных,
n
a j p
F
= ∑
x
      ,         p = 1 , m  
e
p
j
λ
i
 специфические факторы, уникальные для
1
p
каждой переменной, p <= m.
где  a
Задачами факторного анализа являются: оп
jp    коэффициенты при общих факторах,
ределение числа общих факторов, определение оце
λ     собственные значения,
нок  λ , определение общих и специфических факто
x
ров.
    исходные данные (вектор столбцы),
Для получения оценок общностей и факторных
Fp    главные компоненты (вектор столбцы).
нагрузок используется эмпирический итеративный
В случае вращения главных компонент соот
алгоритм, который сходится к истинным оценкам
ношения, связывающие исходные переменные и зна
параметров. Сущность алгоритма сводится к сле
чения факторов, несколько усложняются. Ниже в
дующему.
матричном виде приведено соотношение, оптималь
Первоначальные оценки факторных нагрузок
ное по скорости вычисления, а также независимое от
определяются с помощью метода главных факторов.
метода вращения факторов:
На основании корреляционной матрицы R формаль
T
T
но определяются оценки главных компонент:
=

B A Λ 2 A x
m
,
m
m
T
B
   повернутая матрица A,
Y
= ∑ α
 ,   ∑ α =
i
x
1 ,  i =1,m
i j
j
i j
A   матрица коэффициентов при общих факто
=1
j =1
рах,
Оценки общих факторов ищутся в виде:
Λ   диагональная матрица m собственных
Y
F
i
=
членов,
i
 ,   i = ,
1 p
λ
x   матрица исходных данных,
i
F   матрица  m  повернутых факторов.
где  λ    соответствующее собственное значе
При определении числа  общих факторов ру
ние матрицы R.
ководствуются следующими критериями: число су
Оценками факторных нагрузок служат величи
щественных факторов можно оценить из содержа
ны
тельных соображений, в качестве p берется число
собственных значений, больших либо равных едини
L
=
λ
ij
a
 ,  i = ,
1
 ,  j = ,
1
ij
j
m
p
це (по умолчанию), выбирается число факторов, объ
ясняющих определенную часть общей дисперсии или
где       оценки   α ,
ij
ij
суммарной мощности.
       Lij     оценки   λ ij .
8. Кластерный анализ
Оценки общностей получаются как
Классификация объектов по осмысленным
p
2
группам, называемая кластеризацией, является важ
2
h
=
∑ L
i
j   i
ной процедурой в различных областях научных ис
1
следований. Кластерный анализ (КА)   это много
16

¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
мерная статистическая процедура, упорядочиваю
кластеров можно представить визуально в виде дре
щая исходные данные (объекты) в сравнительно од
вовидной диаграммы, часто называемой дендро
нородные группы. Общим для всех исследований,
граммой. Наконец, для понимания этого класса ме
использующих КА, являются пять основных шагов:
тодов не нужны обширные знания матричной алгеб
отбор выборки для кластеризации;
ры или математической статистики. Вместо этого
• определение множества признаков, по кото
дается правило объединения объектов в кластеры.
рым будут оцениваться объекты в выборке;
Для “ОЛИМП:СтатЭксперт” разработана про
• вычисление значений той или иной меры
грамма кластерного анализа, основанная на иерар
сходства между объектами;
хической агломеративной процедуре и позволяющая
• применение метода КА для создания групп
пользователю управлять процессом кластеризации.
исходных данных;
Коротко поясним сущность предлагаемого метода.
• проверка достоверности результатов кла
Сначала ищутся два наиболее близких объекта
стерного решения.
(предположим, A и B). Предположим,  что расстояние
Каждый из перечисленных шагов играет суще
между объектами A и B равно R. В один кластер объ
ственную роль при использовании кластерного ана
единяются объекты, расстояние между которыми
лиза в прикладном анализе данных. При этом 1, 2 и 5
меньше, чем (10 C)*R, где C   четкость классифика
шаги целиком зависят от решаемой задачи и должны
ции, параметр управления процессом, принимающий
определяться пользователем. Шаги 3 и 4 выполняют
значения от 1 до 10, который может меняться поль
ся программой кластерного анализа.
зователем. При С=10 на каждом шаге объединяются
Сделаем несколько замечаний общего харак
только два самых близких элемента, т.е. имеет место
тера.
иерархическая агломеративная процедура в чистом
Многие методы КА   довольно простые проце
виде. Однако, как показывает практика использова
дуры, которые не имеют, как правило, строгого ста
ния КА, пользователю важнее выделить в простран
тистического обоснования. Другими словами, боль
стве группы объектов с разной плотностью. В этом
шинство методов КА являются эвристическими. Это
случае величину С необходимо уменьшать. Мини
позволяет повысить понимание метода и, таким об
мальное расстояние R пересчитывается на каждом
разом, свести к минимуму вероятность допустить
шаге кластерного анализа.
ошибку при трактовке результатов КА.
Объединение. На каждом шаге кластерного
Разные кластерные методы могут порождать
анализа происходит объединение объектов, т.е. из
различные решения для одних и тех же данных. Это
нескольких объектов образуется один кластер. Про
обычное явление в большинстве прикладных иссле
цедура кластеризации заканчивается тогда, когда
дований. По видимому, окончательным критерием
все первичные объекты исчерпаны. Допустим, на м
является удовлетворенность исследователя резуль
шаге объединяются n объектов. Из этих объектов
татами КА.
образуется один кластер как центр тяжести этих объ
Разработанные кластерные методы образуют
ектов (среднее арифметическое по каждой коорди
семь основных семейств:
нате).
• иерархические агломеративные методы;
Размерность задачи уменьшается на величину
• иерархические дивизимные методы;
n 1 (n объектов удаляются, один добавляется). Далее
• итеративные методы группировки;
производится пересчет матрицы расстояний.
• методы поиска модальных значений плотно
В программе реализован кластерный анализ
сти;
наблюдений, т.е. в результате вычислительной про
• факторные методы;
цедуры каждое наблюдение относится к той или иной
• методы сгущений;
группе. Кластеризация проводится на основе одной
• методы, использующие теорию графов.
из двух метрик:
По данным некоторых исследований, прибли
k
Евклидово расстояние:   =
( x − y )2
зительно 2/3 приложений КА используют иерархиче
i
i
=1
ские агломеративные методы. Рассмотрим его сущ
ность на примере наиболее простого метода одиноч
Корреляционное расстояние:  − rxy ,
ной связи.
где  { x , x ,..., x } и  {y ,y ,...,y }
Процесс кластеризации начинается с поиска
1
2
k
1
2
k
двух самых близких объектов в матрице расстояний.
две точки;
На последующих шагах к этой группе присоединяется
rxy    парный коэффициент корреляции между
объект, наиболее близкий к одному из уже находя
x и y.
щихся в группе. По окончании кластеризации все
Графическая интерпретация
объекты объединены в один кластер. Отметим не
Для графической интерпретации результатов
сколько важных особенностей иерархических агло
кластерного анализа приводится график расположе
меративных методов. Во первых, все эти методы
ния исходных объектов в пространстве первых двух
просматривают матрицу расстояний размерностью
главных компонент. При этом объекты, попавшие в
N*N (где N   число объектов) и последовательно объ
один кластер, отображаются одним цветом.
единяют наиболее схожие объекты. Именно поэтому
Примечание. Иногда объекты из разных кла
они называются агломеративными (объединяющи
стеров расположены столь близко, что может соз
ми). Во вторых, последовательность объединения
даться иллюзия о неправильной классификации. Это
17

¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
связано с тем,  что классификация проводится по
T
1
=

[
],
большому числу переменных, а график строится по
2
двум координатам (хотя и отражающим основные
где     оценка математического ожидания ря
особенности данных), поэтому некоторые расхожде
да Y(t). Последнее слагаемое добавляется в том слу
ния между результатом классификации и графиче
чае, когда T   четное число. Коэффициенты вычисля
ским отображением неизбежны.
ются по соотношениям:
9. Частотный анализ
S
2πj
∑ ( y ⋅ cos(
t
j
))
T
t
T
Вместе с долговременными изменениями во
=1
временных рядах часто появляются более или менее
S
π
∑ ( y
2 j
⋅ sin(
⋅ t ))
регулярные колебания. Эти   изменения наблюдае
j
T
t
T
=1
мых значений могут быть строго периодическими или
S
близкими к  таковым и оцениваться в частотном ас
a
1
=
∑ y
T
⋅ −
T /
(
(
)
1
))
2
T
t
пекте. Для выявления наличия и устойчивости перио
t 1
=
да колебаний обычно используется следующий ап
Таким образом, временной ряд представлен в
парат частотного анализа:
виде суммы гармоник. Мощность каждой гармоники
• гармонический анализ (
равна
• спектральный анализ (
R2
a2
b2
=
+
k
k
k
• частотная фильтрация (
я гармоника  считается  статистически  зна
• кросс спектральный анализ.(
чимой,  если  она вносит существенный вклад в дис
Этот аппарат позволяет с разных позиций ана
персию временного ряда, то есть если отвергается
лизировать исследуемый показатель, однако он эф
статистическая гипотеза о том, что   R
фективен лишь при наличии достаточно большого
=0.  Для про
объема данных (по разным литературным источни
верки гипотезы вычисляется критерий:
кам желательно иметь 200 300 наблюдений, но не
TR 2
,
менее 50 наблюдений), из которых предварительно
2
4σ k
исключена тенденция (за исключением методов час
2
тотной фильтрации).
   где  σ    оценка дисперсии отклонения вы
Дадим определения основных терминов час
числяемых значений от фактических:
тотного анализа.
T


2
1
2
2
Интервал времени, необходимый для того,
σ
T
=
 ∑


k
yt
Ty
Rk 
T
2
−  =

чтобы временной ряд начал повторяться, называется
t 1
периодом. Он измеряется числом единиц времени
Вычисляемая величина имеет F
за цикл и не является единственным. Если между пи
распределение с   ν =  и   ν
−  степенями
1
2
ками (высшими точками) или впадинами (низшими
свободы. Гипотеза отвергается, то есть гармоника
точками) проходит 10 месяцев, то период этого цикла
считается значимой, если вычисленная величина
равен 10 месяцам.
больше, чем 95% точка распределения  с соответ
Величина, обратная периоду, называется час
ствующими степенями свободы.
тотой ряда. Она указывает число повторений цикла в
единицу времени и поэтому измеряется числом цик
Спектральный анализ
лов в единицу времени. Если между пиками
Рассмотрим алгоритм спектрального анализа.
(высшими точками) или впадинами (низшими точка
Пусть  x(t), t = 0,1, ... , T    временной ряд. Тогда
ми) проходит 10 месяцев, то период этого цикла ра
его периодограмма рассчитывается как
вен 10 месяцам, а частота 1/10.
2
Амплитуда периодического ряда   это откло
1
(T )
1

нение от среднего значения до пика или впадины.
I
( f ) =
∑ x(t )exp{ i2πft
xx
}
T
=
Фаза   представляет собой расстояние между
t 0
началом отсчета времени и ближайшим пиковым
   Предполагается, что исходные данные кван
значением.
тованы с интервалом 1 и,  следовательно, частота
Найквиста для них равна 0,5. Поэтому периодограм
Гармонический анализ
ма и спектральная плотность  рассчитывается на ин
Временной ряд наблюдений может быть пред
тервале от 0 до 0.5. в точках f(j)=j/2M, j=0,1,...M.
ставлен с помощью линейных комбинаций функций
  Оценка спектральной плотности, реализо
времени    синусов и косинусов, на основании конеч
ванная в программе, основана на оценке Бартлетта,
ного преобразования Фурье. Гармонический анализ
которая является усреднением периодограмм, вы
позволяет выявить наиболее существенные гармони
численных по непересекающимся отрезкам времен
ки. Пусть  Y(t)    временной ряд t=1,2...T. Тогда имеет
ных рядов. В программе спектральная плотность при
место следующее представление ряда:
T=L*V. оценивается аналогично, только временные
2πj
2πj
интервалы могут пересекаться. Пусть
+ ∑(a cos(
t ) b sin(
t )) +
t
j
j
T
T
+[a
t
(

T
)
1
]
/
18

¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
2
m
V
1
1
1
~
q(w ) =
∑ λ

ω
j
(C
( k )
C
( k
xy
yx
))sin k
I (V ) (f ,l ) =
∑ x(v lV )exp{i2πf(v lV
j
xx
)}
2π =
V
k 1
=0
 j
,l 0, ,
1 ... L
− ,
1
ω
π
=
=
j
j
0, ,
1 ...,m
m
где V   ширина временного интервала;
Оценка когерентности:
l   номер интервала;
~
2
2
~
c(ω )
~
q(ω )
   смещение текущего временного интервала
j
j
C(ω =
j
~
~
относительно предыдущего.
f (ω )f (ω )
x
j
y
j
Тогда оценка спектральной плотности получа
Оценка фазового сдвига:
ется как
~
 q(ω )
L
1
1
~
ϕ
j
(ω arctg

f
(f )
I(V )
=

(f ,l
j
~
xx
xx
)
c(
 ω )
L
j



=0
Спектральные оценки сглаживаются при по
Оценка коэффициента усиления:
~
~
мощи "окон", которые применяются с целью умень
~
f (ω )C(ω )
2
x
j
j
шения дисперсии выборочной спектральной плотно
R
(ω =
xy
j
~
f (ω )
сти. На практике из большого числа известных окон,
y
j
используются следующие три:
• 
Оценка спектра  ~
 для ряда x в настоящем
прямоугольное;
x
• окно Тьюки   Хеннинга;
разделе имеет следующий вид:
• окно Парзена.
~
m


f (ω 1
0
2
2
λ C ( )
0
+ ∑ λ C (k )cosω k
x
j
x
k
x
j

Окно
Формула
π 
=1

Прямоугольное
λ =1,  0 ≤ ≤
k
k
m
Тьюки
n− k
n
n− k
1

1



Хеннинга
λ
π
=
+
C
k
 ∑ x x + −
∑ ∑ 
k
cos
(
=
t
t k
t
t
2
m




−  t 1
n
=
− k t=k+1
=1

Парзена

~
6k 2 

Аналогично получается оценка спектра   f
m

 для


, 0
k

m
≤ ≤ 2
ряда y.
λ

m
=
k

Интерпретация результатов кросс
 
3

m
2 1 

k
m

спектрального анализа   довольно тонкий процесс.


m
≤ ≤

2
Отметим, что когерентность аналогична квадрату
Параметры, необходимые для расчета спектра
коэффициента корреляции на соответствующей час
мощности, рассчитываются по следующему алго
тоте и интерпретируется таким же образом. Коэф
ритму:
фициент усиления есть, по сути, коэффициент ли
V=n/3 (n   число наблюдений)
нейной регрессии процесса  по процессу на соответ
при  V<10 принимается V=10;
ствующей частоте. Фазовый сдвиг характеризует
при  V>50 принимается V=50  S=V/2
временное смещение между составляющими двух
процессов.
Кросс спектральный анализ
Частотная фильтрация
Кросс спектральный анализ оценивает связь
между частотными составляющими двух временных
Фильтрация осуществляется при помощи вы
рядов при помощи параметров когерентности , фа
сокочастотного и низкочастотного фильтра, для каж
зового сдвига и коэффициента усиления. Рассчиты
дого из которых рассчитывается соответствующая
ваются оценки взаимных ковариационных функ
силовая и фазовая характеристики. Низкочастотный
ций:
фильтр предназначен для устранения тренда
(низкочастотной составляющей временного ряда
nk
n
nk
1

1

C
k
 ∑ x y + −
∑ ∑ x
наблюдений). Высокочастотный фильтр, наоборот,
xy (
=
t
t k
t

−  t 1
n
=
− k t=k+1 t=
предназначен для выделения тренда из исходных
nk
n
nk
1

1

данных.
C
k
 ∑ y x + −
∑ ∑ y
yx (
=
t
t k
t

− 
Выход низкочастотного фильтра  e
t 1
n
=
− k t=k+1
=1

 полу
Оценка ко спектра (действительной части
чается из выражения:
спектра):
− 2 x a e
0
a e
1
a e
t
t
t
t
t
2
,
~
λ
2
с( w ) =
0
+
0
+
где  k 2 ,
j
(C ( ) C (
xy
yx
))
π
0
4
2
=

m
a
2( k
1
1),
∑ λ
+
ω
(C
( k )
C
( k )
xy
yx
)cos kj
2π
2
=1
a
1− k
2
2 ,
Оценка квадратурного спектра (мнимой части):
tg( Ω ),
2
Ω    частота отсечки,
et  является  оценкой  высокочастотной  со
ставляющей.  При оценке его теряются два первых
19



¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
наблюдения. Оценкой тренда в этом случае является
Операционная система MS DOS версии 4.0
ряд  − e
или более поздней;
t
t
.
Одна из следующих операционных оболочек
Выход высокочастотного фильтра  et  полу
Windows:
чается из выражения:
русское издание Windows 3.1 или более позд
− 2 x a e
0
a e
1
a e
t
t
t
t
t
2
,
ней версии,
русское издание Windows для рабочих групп
где  = + k 2
1
k
0
2 ,
3.11,
2( k 2 +
русифицированный Windows 3.1.
1
1),
Windows’95
a
= + k 2
1
− k
2
2 ,
персональный компьютер с процессором
tg( Ω ),
80386 или выше (рекомендуется Pentium);
2

8 Мбайт оперативной памяти;
   частота отсечки,
3 Мбайта свободной памяти на жестком диске;
et  является  оценкой  низкочастотной  состав
Дисковод для работы с 3.5   дюймовыми дис
ляющей.  При оценке  et  теряются два первых на
кетами высокой плотности;
блюдения. Ряд может быть использован для прогно
Графический адаптер VGA, совместимый с
зирования.
Microsoft Windows 3.1 (рекомендуется адаптер с раз
решением не ниже 800 X 600);
10. Работа с математическим
Устройство “мышь”;
аппаратом на компьютере
Установленная на компьютер программа
Microsoft Excel 5.0 (Excel 7.0 для Windows’95).
Общие сведения о программном
 При наличии указанных выше ресурсов можно
обеспечении
начать инсталляцию программы. Для этого запустите
программную оболочку Windows и вставьте устано
Программа “ОЛИМП:СтатЭксперт” предназна
вочную дискету в дисковод. Затем в Диспетчере про
чена для статистического анализа и прогнозирования
грамм в пункте “Файл” выполните функцию
развития финансово   экономических и ряда других
“Выполнить”  как показано ниже.
процессов, представленных временными рядами
Примечание: все диалоги в данном разделе
наблюдений и пространственными данными.
документации получены в русифицированной версии
 Реализованный в ней математический аппарат
англоязычного Windows.
позволяет решать широкий спектр практических за
дач: оценивать текущее состояние процесса, иссле
довать и прогнозировать динамику развития с учетом
тенденции, а также сезонных и циклических колеба
ний, определять степень взаимосвязи исследуемых
показателей и отражать их в форме математических
моделей, проводить классификацию объектов и др.
Программа поставляется в двух версиях,  от
личающихся широтой реализованного в них матема
тического аппарата: базовой и профессиональной.
Базовая включает средства описательной статистики
После того как Вы нажмете клавишу “ОК”, на
количественных данных, методы анализа и прогнози
чинает работу программа установки. Она анализиру
рования одномерных временных рядов, корреляци
ет состояние системы, после чего отображается
онный и регрессионный анализ. Профессиональная
диалоговое окно.
версия включает базовую и имеет более широкие
возможности обработки многомерных данных
(факторный анализ, компонентный, гармонический,
частотный, спектральный, кросс  спектральный и
кластерный анализ).
Для независимого использования вычисли
тельных библиотек “ОЛИМП:СтатЭксперт” отдельно
поставляется руководство программиста.
Комплектность поставки
В том случае, когда Вы выбираете клавишу
“Выход”  (здесь или далее в процессе установки),
В комплект поставки входит одна (3.5
отображается диалоговое окно, приведенное ниже.
дюймовая) инсталляционная дискета, настоящее
руководство, лицензионное соглашение и регистра
ционная карточка.
Варианты установки
Для работы “ОЛИМП:СтатЭксперт” необходи
мо:
20








¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Если Вы выбираете “Продолжить”, Вам необ
ходимо заполнить свои координаты в следующем
По окончании процесса установки система
диалоговом окне.
отображает заключительное диалоговое окно вида
Далее Вы должны правильно (это очень важ
но) ввести регистрационный номер программы, ко
торый  отпечатан на установочной дискете.
после чего создается программная группа
”ОЛИМП” с несколькими иконками.
По окончании работы программы инсталляции
на Вашем компьютере появятся следующие модули,
В следующем диалоге необходимо задать уст
необходимые для нормальной работы
ройство и путь к директории, в которой  будет раз
“ОЛИМП:СтатЭксперт”:
мещена система. Следует учесть, что часть систем
OLYMP.XLA;
ных файлов будет размещена в системной директо
OLYMPSYS.XLS;
рии Windows. Кроме того, текущая версия программы
* OLYMP.HLP;
установки “ОЛИМП:СтатЭксперт” не проверяет нали
*OLYMPSTS.DLL;
чие свободного места на жестком диске.
* OLYMPSET.DLL (OLYMPS32.DLL для
Windows95);
* OLYMPRES.DLL (OLYMPR32.DLL для
Windows95);
* OLYMPKRN.DLL (OLYMPK32.DLL для
Windows95);
а также дополнительные текстовые и демонст
рационные файлы:
Read.Me;
ReadMe.wri;
Demo.XLS.

Процесс копирования и декомпрессирования
Файлы, помеченные символом “*”, размеща
файлов системы иллюстрируется в диалоговом окне
ются в системной директории Windows, остальные
следующего вида.
файлы   в директории, указанной пользователем при
установке программы.
Для того чтобы перенести систему на другой
компьютер, необходимо сначала удалить ее с компь
ютера, на который она была установлена, т.е. выпол
нить деинсталляцию программы. Для этого следует
вставить дистрибутивную дискету в устройство “а:”
21



¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
и воспользоваться пиктограммой “Удаление Стат
Перспективы развития программного
Эксперта”. После этого дистрибутивную дискету
обеспечения
можно использовать для повторной инсталляции
Развитие данной версии программы, прежде
программы.
всего, будет происходить за счет расширения круга
Технические ограничения
задействованных моделей и методов, обеспечения
При практической работе с программой Вы
более широкой возможности управления вычисли
вряд ли ощутите наличие ограничений, однако они,
тельным процессом, путем изменения параметров
все же,  существуют.
моделей. В частности, предусматривается разработ
Для обработки пользователь должен выделить
ка модулей структурного анализа и обработки нечи
в электронной таблице блок данных. Величина этого
словой информации, включающей в себя расчет ран
блока не ограничена.  Однако существует ограниче
говых корреляций и анализ таблиц сопряженности.
ние на объем непосредственно обрабатываемых
Запуск программы
данных вычислительными методами.  В частности,
После инсталляции программы создается про
поскольку вычисления, проводимые модулями Си++,
граммная группа “OЛИМП” (“OLYMP”). Для запуска
осуществляются с числами с двойной точностью, а
программы необходимо нажать на кнопку
память под объекты выделяется сегментами,  не пре
"СтатЭксперт". Кроме этого, программа может быть
вышающими 64K байт, объем обрабатываемых дан
стартована непосредственно из Excel. В последнем
ных не должен превышать 8190 чисел. При проведе
случае в меню “Файл”  “Открыть”(“File”  “Open”) не
нии корреляционного анализа количество обрабаты
обходимо найти файл OLYMP.XLA. После его запуска
ваемых переменных не должно превышать 120. При
автоматически загружается файл OLYMPSYS.XLS,
работе в Windows 95 эти ограничения отсутствуют!
который открывает одноименную книгу. В ней со
Все результаты вычислений выдаются в таб
держится пустая таблица с именем “Data”, предна
лицу “Report”. Поэтому размер выходного протокола
значенная для размещения обрабатываемых данных,
каждой порции результатов ограничен размерами
а для временного размещения результатов расчетов
электронной таблицы и не должен превышать 16000
создается таблица "Report".
строк.
Признаком начала работы программы являет
Для нормальной работы программы в Excel не
ся модификация строки основного меню Excel и по
обходимо проверить правильность установки  неко
явления заставки с вашими реквизитами, представ
торых параметров, связанных с работой модулей
ленной ниже.
Visual Basic. Для этого войдите в меню “Сервис”
(“Tools”), выберите пункт “Параметры” (“Parameters”)
и убедитесь в отсутствии символа выбора (“крестик”)
рядом с параметрами:
 “Останавливаться на всех ошибках” (“Break
on all Errors ”);
 “Требовать описания всех переменных”
(“Require variable Declaration”).
Если символ выбора ("крестик") стоит слева от
этих параметров   уберите его, сохраните новые ус
тановки, перезапустите Excel и запустите программу
“ОЛИМП:СтатЭксперт”.
Проверьте также системные установки. В при
ложении "Панель управления" в пункте "Стандарты"
Для начала работы нажмите клавишу “Enter”
параметр "Разделитель списка" должен соответство
или левую кнопку “мышки”, установив ее указатель на
вать символу "запятая",  а параметр "Формат числа"
кнопку “Начало работы”. После этого появится ин
должен использовать разделитель "точка".
формационное сообщение вида:
В случае использования англоязычных версий
Windows и MS Office, русифицированных программа
ми Cyrwin, Parawin или другими, для корректного
отображения текстовой информации, необходимо в
секцию [Font Substitution] файла WIN.INI, поместить
строку:  ArialCyr=[имя русифицированного шрифта
без засечек].
При этом шрифт Arial Cyr должен отсутствовать
в списке установленных в Windows шрифтов. Имя
После нажатия кнопки "ОК" можно начинать
шрифта различно для различных русификаторов.
работу с программой.
Например, для Cyrwin 4.х имя шрифта может быть
Меню программы
“NT Harmonica”. Подробнее смотрите документацию
После запуска программы
по конкретному русификатору. Программа
"ОЛИМП:СтатЭксперт" в строке основного меню
“ОЛИМП:СтатЭксперт” не может нормально работать
Excel появляется пункт “СтатЭкc”, при активизации
при  двух одновременно работающих экземплярах
которого (“мышкой” или горячей клавишей “Ctrl+ Э”)
программы Excel.
раскрывается меню из 12 пунктов:
22



¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Вес характеристики точности в критерии каче
ства модели изменяется в диапазоне от 0 до 100% с
Это меню программы "ОЛИМП:СтатЭксперт"
шагом 1%. При минимальном значении этого пара
доступно из книги пользователя и из рабочей книги
метра качество модели определяется только харак
OLYMPSYS.XLS.
теристикой ее адекватности, а при максимальном
Семь пунктов меню “СтатЭкс” (Дескриптивная
значении   только характеристикой точности. По
статистика, Временные ряды, Корреляция, Регрес
умолчанию он задан величиной 75%, что свидетель
сия, Факторный анализ, Кластерный анализ, Частот
ствует о приоритете характеристики точности при
ный анализ) соответствуют вычислительным мето
формировании вывода о качестве построенной мо
дам, назначение и способ  реализации которых опи
дели.
саны в соответствующих разделах. Отметим, что пе
Параметр сглаживания при построении обоб
ред тем как воспользоваться любым вычислитель
щенного прогноза  изменяется в диапазоне от 0 до
ным методом, в Excel таблицу следует ввести любым
100% с шагом   1%. По умолчанию он задан величи
способом исходные данные. Техника их подготовки
ной 85%, что свидетельствует о приоритете свойств
подробно описана в разделе 1.5.
инерционности над свойствами динамики исследуе
Примечание.  В базовой версии программы
мого процесса.
Факторный анализ, Кластерный и Частотный анализ
Точность вычислений изменяется в диапазоне
отключены, а соответствующие им пункты меню за
от 0.00001 до 0.5. По умолчанию она задана величи
блокированы.
ной 0.002.
Пункт "Формат данных" определяет способ
Максимальное количество итераций по умол
подготовки данных. При его запуске появляется диа
чанию задано величиной 500. При достижении ука
логовое окно "Установки блоки данных", вид которого
занного значения данного параметра процесс вычис
представлен в разделе "Подготовка данных". Ис
ления параметров модели завершается даже в том
пользование данного пункта целесообразно лишь в
случае, когда заданная точность еще не достигнута.
том случае, если Вы собираетесь длительное время
Диапазон изменений этого параметра   от 5 до 1000.
работать с одним и тем же шаблоном данных и оди
Шаг изменения   5. Параметры точности вычисления
наковой ориентацией таблицы и хотите отключить
и максимального количества итераций используются
постоянное высвечивание диалогового окна
при построении адаптивных и параметрических мо
“Установка блока данных” перед запуском метода
делей прогнозирования, а также логистической кри
вычислений. Для этого достаточно убрать символ
вой и кривой Гомпертца.
выбора (“крестик”) перед элементом “Запрос шаб
Уровень значимости коэффициентов регрес
лона данных на каждом шаге обработки”. Когда поя
сии по умолчанию задан величиной 85. Диапазон из
вится необходимость в его появлении, в меню
менений этого параметра   от 60 до 99. Шаг измене
“CтатЭкс” снова выберите пункт “Формат данных” и
ния   1. Значение этого параметра используется для
сделайте новые установки.
цветовой диагностики значимости коэффициентов
Пункт “Параметры” позволяет переустано
линейной регрессионной модели.
вить числовые значения основных параметров про
Задание новых значений параметров (кроме
граммы. При активизации пункта "Параметры" меню
точности) осуществляется при помощи спинера, а
"CтатЭкс" появляется диалоговое окно
параметр точности устанавливается путем непосред
“Регулируемые параметры программы”, позволяю
ственного ввода нового значения. Для фиксирования
щее изменить значения ряда важных параметров.
новых значений параметров необходимо нажать
кнопку “Установить”. Новые значения действуют в
течение текущего сеанса работы и при перезапуске
программы они принимают первоначальное значе
ние, установленные программой.
Нажатие кнопки “Восстановить” приводит к
восстановлению первоначально заданных значений
параметров. Нажатие кнопки “Выход” не фиксирует
новых значений параметров, если они были заданы.
23

¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
Пункт “Справка” содержит краткую информа
онного блока при помощи операций "Удалить стро
цию о разработке и пользователе программы.
ку", "Удалить столбец", либо  заменены числовыми
Пункт “Помощь” обеспечивает вызов описа
значениями. Восстановление пропущенных наблю
ния программы. Техника использования “Помощи” в
дений можно осуществить самостоятельно
программе “ОЛИМП:СтатЭксперт” полностью совпа
(экспертным путем) или при помощи программы од
дает с Excel. В частности, для того, чтобы подробнее
ним из трех способов, описанных в 1.7.1.
узнать о каком либо ключевом термине (в тексте
Этап 4. "Выполнение вычислений". Запуск
“Помощи” он выделен подчеркиванием, а при сохра
вычислительных методов осуществляется путем
нении системных установок   еще и зеленым цве
активизации внедренного в основное меню Excel
том), необходимо установить на него курсор и нажать
пункта "СтатЭкс" и выбора в нем желаемого метода
левую кнопку “мышки”.  Кроме  основного текста
обработки. На этапе вычислений появляется различ
Help'а Вы сможете получать контекстную помощь на
ная по виду заставка, в нижней левой части которой
всех этапах работы. В диалоговых окнах, опреде
отражается название этапа работы программы. В
ляющих направление и параметры работы, она вызы
зависимости от этапа работы выдается сообщение:
вается нажатием кнопки “Помощь” или функциональ
“ОЛИМП:СтатЭксперт готовится”   на этапе
ной клавиши “F1”, а при просмотре результатов   по
удаления результатов предыдущих вычислений, пе
мощь придет к Вам при выборе пиктограммы
реноса данных в рабочую таблицу;
“Помощь”, расположенной в левой части экрана (см.
“ОЛИМП: СтатЭксперт думает ”   на этапе вы
раздел 1.6.2).
полнения вычислений;
Пункт “Очистить” закрывает книгу
“ОЛИМП: СтатЭксперт формирует отчет”   на
OLYMPSYS.XLS и удаляет все рабочие пиктограммы
этапе подготовки отчета в таблице Report;
программы. После этой операции пункт “СтатЭкс”
“ОЛИМП: СтатЭксперт уже рисует графики!” 
остается в основном меню, и все вычислительные
на заключительном этапе графического оформления
возможности программы "ОЛИМП:СтатЭксперт", по
результатов вычислений, если графики были заказа
прежнему, доступны. Полная выгрузка программы
ны.
происходит лишь при выходе из Excel.
Программа “ОЛИМП:СтатЭксперт” общается с
Технология обработки данных
пользователем при помощи диалоговых окон. Техни
ка работы с ними  является стандартной для Windows
Технология обработки данных при помощи
и одинаковой для всех этапов и методов вычислений.
программы сводится к выполнению следующих эта
Выбор объектов в диалоговом окне можно осуществ
пов:
• 
лять при помощи  “мышки” или  клавиатуры.
запуск программы;
• 
“Мышка” является наиболее удобным средст
подготовка данных;
вом указания интересующего Вас объекта, а во мно
• проверка данных и восстановление пропу
гих случаях и изменения их состояний и значений. Ее
щенных наблюдений;
можно быстро установить на любой объект окна (в
• выполнение вычислений;
отличие от клавиши табуляции, активизирующей их в
• просмотр, печать и сохранение результатов;
строгой последовательности).
• завершение работы.
Многие параметры диалогового окна имеют
Очевидно, что первый и последний из указан
только два состояния: “включен / не включен”. К их
ных пунктов выполняются в течение одного сеанса
числу относятся, например, конкретные таблицы от
работы в среде Excel однократно, в то время как ос
чета. Графически состояние такого параметра ото
тальные этапы могут быть реализованы многократно
бражается в виде маленьких квадрата или кружочка,
над одними и теми же или разными данными.
располагающихся слева от параметра, к которому
Этап 1. "Запуск программы"  подробно опи
они относятся. Наличие символа “крестик” в квадра
сан в разделе 1.2.
те или темной точки внутри кружочка означает выбор
Этап 2. "Подготовка данных" подробно опи
параметра. Для изменения состояния необходимо
сан в разделе 1.5. Отметим, что на вход вычисли
установить указатель “мышки” на квадрат или кружок
тельным модулям могут быть поданы как исходные
и один раз нажать левую кнопку “мышки”.
данные, так и преобразованные. Преобразование
Значение многих параметров меняется при
данных может осуществляться при помощи стан
помощи “спинера” (прямоугольник с двумя верти
дартных возможностей Excel, в частности, формуль
кальными стрелками), который располагается справа
ных соотношений, а также с использованием много
от параметра. При нажатии стрелки “вверх” значение
численных функций (логарифмирования, квадратно
показателя увеличивается, при нажатии стрелки
го корня, тригонометрических функций и др.).
“вниз”   уменьшается на единицу.
Этап 3. "Проверка данных и восстановле
Если “мышка” не подключена к Вашей машине,
ние пропущенных наблюдений".
для выбора параметров в диалоговых окнах придется
Выделенные пользователем данные могут со
использовать клавиатуру. В этом случае для обраще
держать нечисловые и пропущенные наблюдения
ния к объектам окна  можно использовать клавишу
(клетки, не содержащие никакой информации). При
табуляции “Tab” или “русскую букву ускоритель”,
обнаружении нечислового значения программа вы
которая в названии объекта помечена подчеркивани
дает соответствующее сообщение и прекращает ра
ем. Клавиша табуляции активизирует объект, после
боту. Пропущенные наблюдения должны быть пред
чего нажатие клавиши “Enter” меняет его значение, а
варительно устранены: либо удалены из информаци
24


¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
буква ускоритель сразу меняет значение параметра
показатель производительности труда. Для этого в
на противоположное.
клетку "K2" занесите наименование переменной 
Этап 5. "Просмотр, печать и сохранение
"Производительность труда", а в клетку "K3" запиши
результатов" подробно описан в разделе 1.6.
те формулу: =B3/F3. После нажатия клавиши Enter в
Этап 6. "Завершение работы". Для завер
этой клетке отобразится вычисленное по формуле
шения работы можно просто выйти из Excel, либо
значение.  Чтобы не повторять эту операцию для всех
воспользоваться пунктом “Очистить”, который за
других строк таблицы, воспользуйтесь командой ко
крывает книгу OLYMPSYS.XLS и удаляет все рабочие
пирования. Для этого установите курсор на клетку
пиктограммы программы. После этой операции пункт
"K3",  выделите клетку ("Правка", "Копировать"), вы
“СтатЭкс” остается в основном меню, и все вычисли
делите курсором диапазон клеток с K4 до K21 и зане
тельные возможности программы, по прежнему,
сите в них самонастраивающуюся формулу
доступны.
("Правка", "Вставка"). После этого в указанном диа
Подготовка данных
пазоне появятся вычисленные значения.
Источником информации для вычислитель
Для всех вычислительных методов данные
ных методов программы может быть активная табли
подготавливаются одинаково   в обычных Excel таб
ца (Sheet) книги пользователя или рабочая книга
лицах, однако  перед выполнением вычислений убе
OLYMPSYS.XLS. В первом случае программа автома
дитесь, что Ваши данные удовлетворяют всем тре
тически переносит отмеченные данные в рабочую
бованиям, изложенным в разделе "Требования к
таблицу  Data книга OLYMPSYS.XLS (делает их ко
данным”. После этого в Excel   таблицу следует лю
пию), причем расчетные показатели, заданные в таб
бым способом ввести данные, обозначить их и лишь
лице пользователя в виде формул, переносятся как
затем запустить какой   либо метод анализа. Более
числовые значения.
подробно процесс подготовки данных описан ниже.
Если в момент запуска метода обработки ак
Источники и формат данных
тивной была таблица “Data” или таблица “Report” (с
Программа "ОЛИМП:СтатЭксперт" восприни
невыделенными данными) рабочей книги
мает данные только через Excel   таблицу. Первона
OLYMPSYS.XLS,  исходные данные берутся из табли
чально данные  в Excel   таблицу заносятся стандарт
цы “Data”. В рабочую таблицу можно переносить свои
ным способом: курсор таблицы (светящийся прямо
данные “вручную” путем их копирования через
угольник) позиционируется на желаемую клетку и с
Clipboard. Этот способ выбора позволяет при необ
клавиатуры вводится желаемые текстовое наимено
ходимости выбирать данные из нескольких таблиц и
вание или число. После нажатия клавиши "Enter" оно
формировать новые, полученные на основе промежу
заносится в активную клетку. При вводе дробных чи
точных  вычислений. Такая технология работы обес
сел уточните используемый символ разделитель це
печивает полную сохранность исходных данных.
лой и дробной части ("Сервис” (Tools)   ”Параметры”
(Options)   ”Модуль” (Module General)    “Числовой
формат” (Number Format)). Им может быть точка или
запятая. При неправильном использовании этого
символа набранные числовые значения заносятся
как текст и воспринимаются нулевым значением.
Если данные были однажды  заведены и со
хранены на диске, их можно прочитать. Проиллюст
рируем этот процесс на демонстрационном примере.
Находясь в Excel   таблице,  выполните цепочку:
"Файл"   "Открыть". Далее активизируйте каталог, в
который при  инсталляции записана программа, и,
наконец, имя демонстрационного файла   DEMO.XLS.
Через непродолжительное время перед вами поя
вится указанная книга, открытая на первой таблице
(см. ниже).
Как правило, для обработки непосредственно
Для определения данных, которые подлежат
используются исходные данные, однако могут ис
обработке, необходимо:
пользоваться и производные от них   преобразован
1. Сделать активной таблицу с данными;
ные данные. Преобразование данных может осуще
2. Отметить в активной таблице блок данных,
ствляться при помощи стандартных возможностей
подлежащей обработке;
Excel, в частности, формульных соотношений, а так
3. В стандартной строке меню выбрать вне
же с использованием многочисленных функций
дренный пункт "СтатЭкс" и, в появившемся меню,
(логарифмирования, квадратного корня, тригоно
выбрать метод обработки;
метрических функций и др.). Например, пусть в ко
4. В диалоговом окне “Установки блока дан
лонке "В" с переменной 21041 записан показатель
ных” указать ориентацию таблицы и  шаблон данных.
"Объем производства", а в колонке "F" с именем пе
Если в ходе работы Вы загрузили несколько
ременной 22012 записан показатель "Численность
книг, то для активизации нужной книги надо восполь
работающих". На их основе можно сформировать
зоваться пунктом "Окно", выбрать имя желаемой кни
25


¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
ги, а затем в корешке ее таблиц выбрать нужную таб
лицу с данными.
В таблице пользователя данные могут распо
лагаться в любом месте, но непременно должны быть
выделены в виде непрерывного блока.   Используя
один из стандартных способов Excel, можно выде
лить
:
 блок клеток (левый верхний угол   правый
нижний);
 колонки (одну или несколько соседних);
 строки  (одну  или несколько соседних).
В случае отсутствия выделенного блока про
грамма переносит все данные в таблицу Data и про
водит  их разбор начиная с клетки А1учитывая уста
Если Вы постоянно работаете с одним и тем
новленный шаблон данных.
же шаблоном данных и одинаковой ориентацией таб
Явное выделение данных в виде фиксирован
лицы, целесообразно отключить высвечивание диа
ного блока является наиболее предпочтительным.
логового окна “Установка блока данных” перед запус
При этом способе независимо от установленного
ком метода вычислений. Для этого достаточно убрать
шаблона первая строка и первый столбец должны
символ выбора (“крестик”) перед элементом “Запрос
содержать информацию (наименования или число
шаблона данных на каждом шаге обработки”. Когда
вые значения).
появится необходимость в его появлении в меню
При неявном выделении данных (строк или
“СтатЭкс”, выберите пункт “Формат данных” и сде
столбцов) первая строка или первый столбец должны
лайте новые установки.
содержать информацию (наименования или число
Для фиксации установок блока данных нажми
вые значения). Разбор таблицы производится до
те кнопку "Установить". Для отказа от продолжения
первой пустой клетки в строке. Количество строк
вычислений (например, если Вы забыли структуру
блока определяется количеством непустых клеток в
выделенного блока)   нажмите кнопку "Отказ".
первом столбце выделенного блока, а количество
Если программа неправильно воспринимает
столбцов блока определяется количеством непустых
данные или выдает сообщение об ошибке, убеди
клеток в первой строке выделенного блока. Поэтому
тесь, что:
независимо от установленного шаблона первая стро
• активной является непустая таблица;
ка и первый столбец должны содержать информацию
• шаблон, объявленный Вами в диалоговом ок
(наименования или числовые значения). При любом
не “Установки блока данных”, соответствует шаблону
способе определения блока данных Вы сможете ука
выделенного блока (ориентация таблицы, наличие
зать конкретный показатель или набор обрабаты
наименований таблицы, переменных, наблюдений);
ваемых данных.
• в выделенном блоке первая строка (при вы
После выбора в стандартной строке меню
делении по колонкам) и первый столбец (при выде
пункта "СтатЭкс", а в нем   метода обработки, поя
лении по строкам) являются непустыми;
вится диалоговое окно "Установки блока данных".
• в активной, но невыделенной таблице поль
Числовые значения показателей, содержа
зователя информационный блок начинается с клетки
щихся в выделенном блоке, могут быть записаны по
А1;
колонкам или по столбцам. Выделенный блок кроме
• количество наблюдений в выделенном блоке
числовых данных может иметь текстовые атрибуты:
не меньше 5;
наименование таблицы, боковик и шапку таблицы.
• символ разделитель дробной и целой части в
При помощи левой кнопки "мышки"  охарактеризуйте
Ваших числовых данных совпадает с символом, кото
ориентацию таблицы, содержащую Ваши данные,  и
рый объявлен в Excel (им может быть запятая или
наличие текстовых наименований (см. подробное
точка, см. “Сервис”("Tools")   ”Параметры”("Options")
изложение в разделах 1.5.2 и 1.5.3). При изменении
 ”Модуль”("Module General")    “Числовой фор
параметров в левой части диалогового окна,  ото
мат”("Number Format")).
бражающей текущий шаблон условных данных, про
исходят  соответствующие изменения.
Ориентация таблицы
Ориентация таблицы характеризует распо
ложение числовых значений исследуемых показа
телей. Таблица может иметь две альтернативные
ориентации:
• по колонке (столбцу);
• по строке.
Если каждое новое значение текущей пере
менной располагается в следующей строке, т.е. дан
ные по каждому показателю располагаются сверху
вниз в одной колонке (например, C4, C5, C6 и т.д.), то
таблица имеет ориентацию “по колонке”. Примером
26

¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
такой ориентации являются приведенные выше дан
разных этапах формирования ряда динамики. Уровни
ные первого листа демонстрационного файла.
во временных рядах должны измеряться в одних и тех
Если каждое новое значение располагается в
же единицах, иметь одинаковый шаг наблюдений,
следующей колонке, т.е. данные по каждому показа
рассчитываться для одного и того же интервала вре
телю располагаются слева направо в одной строке
мени, по одной и той же методике, охватывать одни и
(например, B4, C4, D4 и т.д.), то таблица имеет ори
те же элементы, относящиеся к неизменной совокуп
ентацию “по строке”.  Примером такой ориентации
ности.
являются данные второго листа демонстрационного
Несопоставимость чаще всего проявляется в
файла.
стоимостных показателях. Даже в тех случаях, когда
Шаблон данных
значения этих показателей фиксируются в неизмен
ных ценах (при наличии методики такого пересчета),
Выделенный блок кроме числовых данных мо
их часто трудно сопоставить. Такого рода несопоста
жет иметь (или не иметь) текстовые стандартные ат
вимость временных рядов не может быть устранена
рибуты таблицы: наименование таблицы, боковик и
чисто формальными методами и может лишь учиты
шапку таблицы. Эти три элемента характеризуют
ваться при содержательной интерпретации резуль
шаблон данных.
татов статистического анализа.
Наименование таблицы (заголовок блока),
ПОЛНОТА данных связана с их количеством.
когда оно присутствует, должно быть  расположено в
Достаточное число наблюдений определяется в за
первой строке и записано в одной клетке.
висимости от цели проводимого исследования ди
При ориентации таблицы “по колонке” в ее бо
намики. Если целью является описательный стати
ковике (то есть первой колонке) отображаются на
стический анализ, то в качестве изучаемого можно
именования наблюдений (обычно это даты или но
выбрать очень короткий интервал времени (но не
мера наблюдений по порядку); а в шапке таблицы, (то
менее 5 наблюдений). Если же целью исследова
есть  строке, непосредственно предшествующей чи
ния является построение модели динамики, то число
словым данным)   наименования переменных
уровней исходного динамического ряда в этом слу
(например, “Курс доллара”, “Объем продаж”). При
чае должно не менее чем в три раза превышать пери
ориентации таблицы “по строкам”   наименования
од упреждения прогноза, и быть не менее 12. В слу
переменных отображаются в боковике, а наименова
чае использования квартальных или месячных дан
ния переменных   в шапке таблицы. Для указания
ных для исследования и прогнозирования сезонных
наличия:
• 
процессов, исходный временной ряд должен содер
наименования таблицы;
• 
жать данные не менее чем за четыре года, даже если
наименования переменных;
• 
требуется прогноз на 1 2 квартала (месяца). В про
наименования наблюдений,
• 
тивном случае эти данные будут обрабатываться без
в диалоговом окне “Установки блока данных”
учета внутригодичных колебаний.
в блоке "Наименование" необходимо поставить сим
Отметим, что пороговое минимальное значе
вол выбора (крестик) рядом с их названием.
ние объема данных можно оценить по статистиче
При изменении установок блока данных в диа
ским таблицам, например, таблица d критерия Дар
логовом окне отображается их текущее состояние,
бина   Уотсона, имеет начальное значение 15. Следо
что позволяет легко определить соответствие теку
вательно, при меньшем объеме наблюдений исполь
щего шаблона данных и выделенного блока.
зование этого ключевого критерия для оценки каче
Совет. Для получения более компактного про
ства модели некорректно.
токола результатов вычислений (в частности, при
Исходные данные могут содержать пропущен
проведении корреляционного анализа) выделите
ные наблюдения. Программа имеет мощный матема
блок данных без наименований показателей. В этом
тический блок их восстановления, который описан в
случае они будут идентифицироваться латинскими
разделе 1.7.1.
буквами, соответствующими их местоположению в
ОДНОРОДНОСТЬ данных означает отсутст
рабочей таблице “Data”.
вие нетипичных, аномальных наблюдений, а также
Требования к данным
изломов тенденций. Аномальность приводит к сме
Формально математические методы анализа
щению оценок и, следовательно, к искажению ре
могут обрабатывать любые данные. Однако для пра
зультатов анализа. Во временных рядах формально
вильного выявления закономерностей они должны
она проявляется как сильный скачок (спад) с после
удовлетворять определенным требованиям. Все ма
дующим примерным восстановлением предыдущего
тематические методы обработки используют аппарат
уровня.
математической статистики, который предполагает,
Для диагностики аномальных наблюдений
чтобы  исходные данные были сопоставимы, доста
предложено несколько критериев, которые, однако,
точно полны, однородны, а временные ряды наблю
не всегда надежны при исследовании временных
дений должны быть еще и устойчивы. Невыполнение
рядов. Так, критерий Ирвина не "ловит" аномаль
одного из этих требований делает бессмысленным
ность, если она проявляется в серединном уровне
применение любого математического аппарата ис
ряда с высокой динамикой, когда скачок велик, но не
следования.
превышает уровней на конце периода наблюдений. В
СОПОСТАВИМОСТЬ данных достигается в
этой связи мы предлагаем модифицировать  указан
результате одинакового подхода к наблюдениям на
ный  метод следующим образом [12,13]. Для всех
или только для подозрительных на аномальность
27







¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
уровней вычисляем среднее значение и среднеквад
Протокол “Корреляционный анализ”;
ратическое отклонение нескольких соседних с ними.
Протокол “Регрессионный анализ”;
Если рассчитанная величина превышает критическое
Протокол “Факторный и компонентный ана
значение, наблюдение считается аномальным. Ано
лиз”;
мальные наблюдения необходимо исключить из вре
Протокол “Кластерный анализ”.
менного ряда и заменить расчетными значениями.
Протокол "Частотный анализ".
Изломы тенденций свидетельствуют об изменении
Подробное описание этих протоколов приве
закономерностей протекания процесса или об изме
дено в соответствующих разделах описания вычис
нении методики вычисления значений показателя.
лительных методов обработки.
Если значение на конце временного ряда "выпадает"
Техника просмотра протокола
из общей тенденции, то без дополнительной содер
Для просмотра  таблиц можно воспользовать
жательной информации о причинах "выброса" на
ся  стандартными клавишами перемещения курсора:
конце ряда не представляется возможным опреде
на новую строку (стрелки Вниз вверх), страницу
лить, является ли это наблюдение аномальным или
(PgDn, PgUp) или в конец таблицы. Для просмотра
свидетельствует о наличии изменения тенденции. В
графиков достаточно нажать "мышку" на пиктограм
этом случае также важно провести качественный
ме желаемого графика. Однако более удобно вос
анализ происходящих изменений или дождаться по
пользоваться меню графиков и таблиц текущей пор
ступления нового наблюдения.
ции результатов. Эти меню появляются после нажа
Если излом тенденции обусловлен изменени
тия на соответствующую пиктограмму
ем методики расчета показателя, то уровни, предше
"ОЛИМП:СтатЭксперт", расположенную с левой сто
ствующие излому тенденции, могут быть использо
роны экрана.
ваны в оценке характеристик динамики и для  по
строения модели при условии их пересчета согласно
   список таблиц отчета;
новой методике. В случаях, когда такой пересчет не
    список графиков отчета;
возможен, эти уровни ряда должны быть исключены
    переход в рабочую таблицу исходных
из рассмотрения. Если излом тенденции отражает
данных “Data”;
изменение закономерностей развития процесса, то в
   помощь.
качестве информационной базы для статистического
Для активизации любой пиктограммы про
анализа могут быть использованы только значения,
граммы "ОЛИМП:СтатЭксперт" необходимо устано
начиная с момента времени, соответствующего по
вить  на нее указатель "мышки" и нажать левую кноп
следнему излому тенденций.
ку "мышки".
 УСТОЙЧИВОСТЬ временного ряда отражает
Ниже приведен фрагмент порции результатов
преобладание закономерности над случайностью в
обработки данных.
изменении уровней ряда. На графиках устойчивых
временных рядов даже визуально прослеживается
закономерность. На графиках неустойчивых рядов
изменения последовательных уровней представля
ются хаотичными, и поэтому поиск закономерностей
в формировании значений уровней таких рядов ли
шен смысла.
Просмотр результатов
Во время формирования отчета на экране по
является  заставка, характеризующая выполняемый
этап. Результатом работы любого вычислительного
метода является отчет, который всегда  помещается
в таблицу Report рабочей книги OLYMPSYS.XLS. При
каждом запуске нового метода обработки предыду
щее состояние  таблицы “Report” уничтожается!
Если  имеющуюся таблицу отчетов Вам нужно сохра
Воспользовавшись пиктограммой 
нить, отпечатайте ее или перенесите ее стандартны
“Помощь”, Вы сможете получить дополнительную
ми средствами Excel в другую таблицу.
информацию о содержании текущей порции резуль
Содержание отчета
татов.
Содержание отчета определяется методом
 Нажатие “мышки”, когда ее указатель уста
(т.е. выполненным этапом вычислений), а его струк
новлен на пиктограмме “Список таблиц отчета”  при
тура   перечнем таблиц и графиков, заказанных в со
просмотре отчета по предварительному анализу дан
ответствующем диалоговом окне. На текущем шаге
ных,  приводит к появлению следующего меню:
может быть получен один из следующих протоколов:
Протокол “Дескриптивная статистика”;
Протокол “Предварительный анализ данных”;
Протокол “Построение моделей и прогнозиро
вание”;
28



¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
вертикальной печати, а также уменьшением шрифта,
например, до 80% от обычного размера. Для этого
следует выполнить следующую цепочку действий:
"Файл" "Печать" "Страница" "Ландшафт" "Масштаб
80% от обычного размера".
Для печати графиков отчета их следует снача
ла активизировать (через пиктограмму или через
список графиков), затем выделить и активизировать
стандартное меню печати (Файл  Печать).
Примечание. Если Вы работаете с не русифи
цированной версией Excel, в распечатанном тексте
Нажатие “мышки” на пиктограмму “Список
или на графиках могут появиться неправильные сим
графиков отчета” приводит к появлению меню вида:
волы.
Вычислительные методы обработки данных
В данном разделе представлено описание
действий пользователя по реализации вычислитель
ных методов. Если вы ознакомились с содержанием
предыдущих разделов по технологии работы с про
граммой, ее запуска, подготовки данных и просмотра
результатов, у Вас не возникнет проблем на этом
этапе работы.
Для иллюстрации действий пользователя вос
пользуемся данными, которые записаны в первых
Для появления таблицы (рисунка) установите
таблицах книги DEMO.XLS. Откройте этот файл само
указатель "мышки" на желаемый пункт и нажмите
стоятельно. Для этого в строке меню Excel выберите
левую кнопку "мышки". При использовании разных
пункт “Файл”, а в ней команду “Открыть”. Далее акти
вычислительных методов содержание этих меню бу
визируйте каталог, в который при  инсталляции запи
дет иным, но техника их использования одинакова.
сана программа, и, наконец, имя демонстрационного
Пункты основного меню “СтатЭкс” доступны из
файла   DEMO.XLS.
таблицы “Report”. Если Вы хотите продолжить вычис
Первая таблица содержит данные о динамике
ления с прежним выделенным блоком данных, можно
цен на вторичных торгах нескольких выпусков ГКО за
сразу же запустить желаемый метод обработки. В
период с 1 сентября по 3 октября 1995 года. Количе
противном случае воспользуйтесь пиктограммой пе
ство наблюдений   19, шаг наблюдения   торговый
рехода в рабочую таблицу “Data” или сделайте актив
день. Таблица с данными по ГКО расположена в
ной таблицу с данными в своей книге.
клетках А1   J21. Она имеет наименование, которое
 Источником данных может быть также таблица
записано в клетке С1, а также наименования наблю
отчета. Для этого достаточно выделить в ней блок
дений (даты торгов), расположенные в первой колон
данных и запустить желаемый метод обработки. На
ке (“А”), и наименования переменных (номера выпус
пример, если в режиме прогнозирования не удалось
ков ГКО), расположенные во второй строке блока.
построить адекватную модель, т.е. в остаточной ком
Числовые данные по каждому выпуску записываются
поненте содержится невыявленная закономерность,
сверху вниз, то есть таблица имеет ориентацию “по
можно в таблице остатков выделить в качестве ин
колонке”. Предположим, что среди этих данных нас
формационного блока графу "Ошибка абсолютная" и
интересует ГКО 22014.
вновь активизировать пункт "Временные ряды" 
Вторая таблица содержит месячные данные о
"Прогнозирование". В результате будет построена
динамике изменения некоторых народнохозяйствен
более точная модель, объединяющая первоначально
ных показателей РФ за период с 1 января 1993 г. по
построенную (функцию   пилот) и уточняющую функ
31 декабря 1994 года. Количество наблюдений    24,
цию поведения остаточной компоненты.
шаг наблюдения   месяц. Таблица ориентирована “по
Сохранение и печать протокола
строке”. Она имеет наименование, а также наимено
Всю порцию результатов или ее часть
вание переменных и наблюдений. Предположим, что
(таблицы и графики) можно сохранить, переместить
среди этих данных нас интересует показатель
в другую программу или таблицу, переформатиро
“Индекс потребительских цен”.
вать или выполнить какое либо другое действие
Третья таблица содержит данные о крупней
стандартными средствами Excel.
ших банках РФ на 1 января 1996 года.
Таблицы отчета можно вывести на печать, ис
Числовые данные в этих таблицах являются
пользуя стандартные возможности Excel, т.е. доста
фактическими, но мы будем акцентировать внимание
точно в основном меню активизировать пункт "Файл",
на технической, а не на содержательной стороне
далее в нем подпункт "Печать", подтвердив свое же
анализа.
лание, нажатием кнопки "OK". Если отчет по ширине
Примечание 1. В каждом вычислительном ме
не умещается на странице, для придания ему ком
тоде может быть получено графическое изображение
пактности следует воспользоваться возможностью
результатов вычислений. Графики существенно
29


¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
улучшают восприятие результатов вычислений, од
бранных данных. В этом случае следует выйти из ок
нако их формирование средствами Excel существен
на диалога, нажав кнопку “Выход”, не начиная вычис
но (иногда почти в два раза) увеличивает общее вре
лений.
мя обработки данных. Если Вы хотите уменьшить
При перемещении курсора (движении указа
время ожидания результатов, откажитесь от графи
теля “мышки”) по списку переменных, справа ото
ков и при установке параметров структуры отчета
бражается график их значений. Установите указа
уберите символ “крестик” около пункта “Построение
тель “мышки” на строку с наименованием интере
графиков”.
сующего нас показателя (ГКО 22014) и нажмите один
Примечание 2. При первоначальном запуске
раз левую кнопку “мышки”. Справа появится график
любого метода в блоке “Структура отчета” все табли
динамики этого показателя. Его можно увеличить до
цы помечены (символом “крестик”) для включения в
размера полного окна. Для этого достаточно нажать
отчет. В отличие от графиков, объем выдаваемых
“мышку”, когда ее указатель установлен на графике.
таблиц почти не влияет на общую продолжительность
При желании график можно распечатать или перене
обработки данных.
сти в другие программы (например, в текстовый ре
Дескриптивная статистика
дактор) стандартными средствами Excel. Возврат в
диалоговое окно из режима просмотра укрупненного
Дескриптивная (описательная) статистика яв
графика происходит при  нажатии  левой кнопки
ляется наиболее простым и распространенным
"мышки", когда ее указатель стоит на графике,  или
средством характеристики исходных данных. Они
клавиши Esc.
позволяют получить представление об особенностях
Для того чтобы заказать появление в отчете
исследуемого показателя и перспективности исполь
какой   либо таблицы, достаточно добиться появле
зования более глубоких методов анализа.
ния символа выбора (крестик) слева от ее наимено
Для запуска режима вычисления дескриптив
вания. Предположим, что для нас представляют ин
ной статистики активизируйте первую таблицу де
терес все результаты вычислений. Поэтому в блоке
монстрационного файла (см. раздел 1.5), установите
“Структура отчета” оставим без изменения установки
курсор на пункт меню “СтатЭкс”, нажмите “мышку” и
на выдачу всех таблиц. Для начала расчетов нажмите
в появившемся меню выберите пункт
кнопку “Вычислить”, после чего появится заставка,
“Дескриптивная статистика”.
внутри которой отображается сообщение о выпол
Ввиду того, что обрабатываемый блок данных
няемом программой этапе работ.
предварительно не был выделен, программа выдаст
При завершении вычислений в листе “Report”
запрос о необходимости обработки данных с верхне
появляется протокол, содержащий 4 таблицы, пол
го левого угла таблицы. В появившемся диалоговом
ный список таблиц можно увидеть после нажатия на
окне “Установка блока данных” убедитесь, что все
пиктограмму (см. также раздел 1.6. “Просмотр ре
проставленные там установки соответствуют нашему
зультатов”).
блоку данных, и поэтому, оставив их без изменения,
Структурно первые две таблицы состоят из
сразу воспользуйтесь кнопкой “Вычислить”. После
двух граф: наименования характеристики и числово
этого появится диалоговое окно “Дескриптивная ста
го значения. Формулы их вычисления приведены в
тистика”.
одноименном разделе второй части данного доку
мента.
Две последние таблицы интервальных рядов
имеют одинаковую структуру. Для них формируются
графики гистограммы, построенные по частости на
блюдений. Для их появления на экране установите
курсор на картинку, расположенную в таблице ре
зультатов, и нажмите “мышку” или воспользуйтесь
второй слева пиктограммой (см. раздел “Просмотр
результатов”).
Протокол режима “Дескриптивная статистика”
A
B
Описательные статистики переменной   22014
Характеристики вариационного ряда
В  “Списке переменных” отображаются наиме
Характеристика
Значение
нования показателей, взятых из блока данных в соот
Число наблюдений
19,000
ветствии с указанным ранее шаблоном. Текущей яв
Среднее значение
79,575
ляется переменная, которая выделена светящейся
Верхняя оценка среднего
80,500
строкой курсора. В начальном состоянии всегда под
свечивается первая строка.
Нижняя оценка среднего
78,649
Примечание. Если бы у нас в списке перемен
Среднекв. отклонение (S)
2,320
ных появились неправильные имена переменных или
Дисперсия
5,381
на графике отобразилась бы странная динамика, это
Дисперсия (несмещ. оценка)
5,680
свидетельствовало бы об ошибочном формате вы
30


¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Среднекв. откл. (несмещ. оценка)
2,383
6
79,436
79,644
79,852
23,000
0,230
Среднее линейное отклонение (L)
2,128
7
79,852
80,059
80,267
10,000
0,100
Момент начальный 2 го порядка
6337,511
8
80,267
80,475
80,682
2,000
0,020
Момент начальный 3 го поpядка
505155,365
9
80,682
80,890
81,097
1,000
0,010
Момент начальный 4 го порядка
40298300,756
Момент центpальный 3 го порядка
6,454
Ãèñòîãðàììà
Момент центральный 4 го порядка
45,815
0,350
Коэффициент асимметрии A
0,517
0,300
Несмещенная оценка  A
0,562
0,250
Среднекв. отклонение A
0,524
0,200
0,150
Коэффициент эксцесса  E
0,000
0,100
Несмещенная оценка  E
0,397
0,050
Среднекв. отклонение E
1,014
0,000
Мода
82,000
75,600
76,667
77,733
78,800
79,867
80,933
82,000
Минимальное значение
75,600
Максимальное значение
82,000
Размах (R)
6,400
Коэффициент вариации по R
8,043
Коэффициент вариации по L
2,674
Коэффициент вариации по S
2,915
 Характеристики интервального ряда
Характеристика
Значение
Среднее значение
79,642
Среднекв. отклонение (S)
2,387
Дисперсия
5,698
Коэффициент асимметрии A
0,525
Коэффициент эксцесса  E
1,387
Предварительный анализ данных
Медиана
80,613
Назначение этого этапа исследования состоит
в формировании предварительных оценок об осо
Мода
81,619
бенностях обрабатываемого показателя и перспек
Коэффициент вариации по S
2,997
тивности применения отдельных методов их обра
А
В
С
D
E
F
ботки.
Интервальный ряд
Данный этап исследования реализуем на ос
Номер
Начало
Сере
Конец
Частота
Час
нове тех же данных (по цене ГКО 22014), что и при
интер
дина
тость
вычислении характеристик дескриптивной статисти
вала
ки, причем стартовать будем из рабочей таблицы
1
75,067
75,600
76,133
2,000
0,105
Data книги OLYMSYS.XLS, куда они уже перенесены
2
76,133
76,667
77,200
3,000
0,158
программой. Если Вы еще находитесь в таблице от
четов “Report”, воспользуйтесь для перехода третьей
3
77,200
77,733
78,267
2,000
0,105
сверху пиктограммой “Переход в рабочую таблицу
4
78,267
78,800
79,333
0,000
0,000
данных (Data)”. Для запуска режима вычисления,
5
79,333
79,867
80,400
1,000
0,053
установите курсор на пункт меню “СтатЭкс”, нажмите
6
80,400
80,933
81,467
5,000
0,263
“мышку” и в появившемся меню выберите пункт
“Временные ряды”.
7
81,467
82,000
82,533
6,000
0,316
Для определения данных можно  поступить тем
Интервальный ряд бутстреп средних
же образом, что был использован в режиме
Номер
Начало
Сере
Конец
Частота
Час
“Дескриптивная статистика”, но на этот раз  выдели
интер
дина
тость
те блок “по строке” с 1 по 21 строку. Выделенный
вала
блок кроме числовых данных имеет наименование
1
77,360
77,568
77,775
1,000
0,010
таблицы, которое записано в  клетке  С1,  а  также
2
77,775
77,983
78,191
1,000
0,010
наименования  наблюдений  (даты  торгов), располо
3
78,191
78,398
78,606
9,000
0,090
женные  в первой колонке  (А),  и  наименования  пе
4
78,606
78,814
79,021
25,000
0,250
ременных  (номера   выпусков  ГКО),   расположенные
во второй  строке  блока.  Числовые  данные  по  каж
5
79,021
79,229
79,436
28,000
0,280
дому  выпуску  записываются  сверху  вниз, т.е.  таб
31



¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
лица  имеет  ориентацию  "по колонке".  Исходя из
можно изменить, но в большинстве случаев это де
этого, в  появившемся диалоговом окне   "Установки
лать нецелесообразно. При малом числе наблюде
блока   данных"   (см. 1.5.1) убедимся,   что   все  про
ний (менее трех периодов сезонности), программа
ставленные   там  установки соответствуют   нашему
блокирует пользовательскую установку сезонности.
блоку   данных,  и   поэтому,  оставив   их  без   изме
Например, при 15 месячных наблюдениях нельзя ус
нения,  сразу воспользуемся  кнопкой  "Установить".
тановить период сезонности равный 12. При обра
Программа  сообщит,  что  последние  246  столбцов
ботке дневных наблюдений, целесообразно провести
выделенных   строк   являются   пустыми,   и   запро
вычисления с периодом сезонности равным "1" и "5".
сит   разрешения  не   использовать  их. Ответьте   на
Последнее значение соответствует недельному ко
этот   запрос   утвердительно,   после   чего  появится
лебанию многих финансовых показателей. В нашем
диалоговое окно "Обработка временных рядов".
примере установим период сезонности равный еди
 .
нице.
Примечание. Установка периода сезонности
больше единицы предполагает использование более
сложных математических моделей, что приведет, в
свою очередь, к существенному увеличению времени
расчетов.
Далее выберите этап работ –
"Предварительный анализ", нажмите на кнопку
"Вычислить", после чего появится диалоговое окно
"Предварительный анализ".
Полнота выдачи результатов вычислений оп
ределяется перечнем таблиц, заказанных в блоке
"структура отчета" диалогового окна.
При   перемещении  курсора   (движении
"мышки")   по  списку   переменных,  справа отобра
жается   график   их   значений.   Установите   указа
тель   "мышки"   на    строку   с наименованием  инте
ресующего  нас  показателя  (ГКО   22014)  и   нажми
те  один   раз  левую кнопку   "мышки".   Справа   поя
вится   график  динамики   этого  показателя.   Его
можно увеличить  до  размера  полного  окна.  Для
этого  достаточно  нажать  "мышку",  когда  ее указа
тель  установлен  на  графике.  При  желании  график
можно распечатать  или перенести в  другие  про
граммы  (например,  в  текстовый  редактор)  стан
дартными   средствами  Ехсеl.  Возврат  в  диалоговое
окно  происходит  при  повторном  нажатии  мышки
Результаты вычислений отражаются в прото
или клавиши Еsс.
коле, для получения которого необходимо заказать
Параметр     "Шаг    наблюдения"     означает
(добиться появления символа выбора "крестик") не
периодичность     наблюдений.    С  формально стати
менее одного элемента отчета (одной таблицы).
стической  точки  зрения  все  соседние  значения
Среди всех предлагаемых направлений иссле
должны  отстоять  друг от друга  на  одинаковом  уда
дования особое место занимает пункт "Определение
лении  (год,  месяц,  торговый  день  и  т.д.). В  нашем
аномальных наблюдений", который доступен при об
случае торговый  день  можно  приравнять  к  кален
работке данных с периодом сезонности, не превы
дарному  и  оставить без изменения  стоящее там
шающем 1. Если он не заказан, проверка обрабаты
значение  "день".  Если  Вы  не  согласны с  этим, ус
ваемого показателя на наличие в нем резко выде
тановите  указатель "мышки" на стоящую справа  от
ляющихся наблюдений не производится.
этого  параметра  стрелку,  нажмите  "мышку"  и  в
После выбора полного отчета нажмите кнопку
появившемся  списке выберите иной шаг наблюде
"Вычислить". Прежде всего, реализуется блок про
ния, например, "прочее".
верки статистической однородности наблюдений.
Параметр "Период сезонности" характери
При проверке данных на аномальность и наличие по
зует оценку периодичности колебаний уровней ряда.
дозрительных наблюдений,  программа выдает за
Он изменяется в пределах от 1 до 12. Значение "1"
прос на их устранение путем замены фактических
характеризует отсутствие колебаний, что характерно
наблюдений на расчетные. В нашем примере появит
для годовых наблюдений. Значения "4" и "12" соот
ся сообщение:
ветствуют периоду колебаний квартальных и месяч
ных данных. Они устанавливаются программой авто
матически при указании пользователем шага наблю
дений "Квартал" и "Месяц". Указанные значения
32


¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
следуемого показателя, ее значение (79,662) не це
лесообразно использовать для характеристики ди
намики.
Таблица "Гипотеза об отсутствии тренда"
содержит результат проверки  отсутствия тренда в
исходном ряду наблюдений на основе двух критери
ев, причем в случае их противоречивости вывод,
представленный в последней строке таблицы, фор
При получении подтверждения (нажатии кнопки
мулируется на основе первого критерия. Если гипо
"Да"), программа записывает новое расчетное зна
теза принимается, использовать для поиска законо
чение в рабочую таблицу “ОЛИМП:CтатЭксперт”, ок
мерностей изменения уровней ряда кривые роста и
рашивая его в зеленый цвет. Если на вопрос о замене
адаптивные методы нецелесообразно. В нашем при
аномального значения Вы ответите отрицательно
мере оба критерия отвергают гипотезу об отсутствии
("Нет"), данные в рабочей таблице ”Data” окрашива
тренда (в графе "Результат" стоит слово "Нет"), и,
ются красным цветом, но не меняются, причем в
следовательно, весь реализованный в программе
этом случае результаты анализа последующих на
математический аппарат целесообразно использо
блюдений могут быть искажены. Если нажать кнопку
вать для последующего прогнозирования.
"Отмена" ("Саnсеl"), проверка прекращается. При
Таблица "Проверка однородности данных"
получении сообщения об аномальности некоторых
содержит результат проверки исходных данных на
наблюдений, следует помнить, что их устранение
аномальность. В таблице отображаются номера по
может существенно изменить (как правило, улуч
дозрительных наблюдений, фактические и расчетные
шить) характеристики модели и результаты прогно
значения, а также значение, присвоенное наблюде
зирования. В этой связи на заданный вопрос ответим
нию после ответа пользователя на запрос о необхо
"Да", так же как и на аналогичный запрос по поводу
димости замены каждого аномального наблюдения.
другого аномального наблюдения.
При положительном ответе на запрос о замене ано
После этого появится заставка, внутри которой
мальных наблюдений новые значения заменяют ста
содержится сообщение о выполнении программой
рые в таблице “Data”. В нашем примере аномальны
соответствующих этапов. Результаты обработки ото
ми признаны 11 и 15 наблюдения, которым присвое
бражаются в Протоколе "Предварительный анализ
ны новые  значения.  При  отсутствии  аномальных
данных", который содержит 7 таблиц (см. ниже).
наблюдений  выдается соответствующее сообщение.
Таблицы "Базисные характеристики дина
 В таблицах "Автокорреляционная функция"
мики" и "Цепные характеристики динамики" со
и "Частная автокорреляционная функция" содер
держат абсолютный прирост, темпы роста и темпы
жатся результаты вычислений нескольких одноимен
прироста, вычисленные по отношению к первому и
ных коэффициентов для исходного и разностного
предыдущему уровням ряда. Динамика показателя
(порядка d) рядов. Разностный ряд идентифицирует
отчетливо видна на графиках. Список графиков поя
ся таким значением порядка, который лучше других
вится при нажатии на вторую сверху пиктограмму
определяет стационарный процесс. На графиках АКФ
отчета ОЛИМП:СтатЭксперт. На рисунке отражена
И ЧАКФ критический уровень значений коэффициен
динамика базисных темпов роста и прироста. Их тра
тов (представленный в последней строке таблиц)
ектории близки, но они существенно разнятся мас
отображается пунктирной линией. Он помогает оп
штабом значений, представленных на левой и правой
ределить порядок авторегрессии и порядок сколь
осях графика.
зящего среднего.
Примечание. На приведенных ниже графиках
базисных и цепных темпов роста масштабы боковых
осей не совпадают с теми, которые автоматически
сформированы программой. Программа использует
числовые данные соответствующих граф, которые
всегда отображаются с тремя знаками в дробной
части. Если Вас это не устраивает, можно, используя
стандартные средства форматирования Excel
(выделить диапазон данных и воспользоваться ко
мандой “Формат Ячейки”(“Format Cells”)), устано
вить желаемую точность представления данных. На
пример, сформатировав данные абсолютных при
ростов как целые значения, а темпов роста   с двумя
знаками в дробной части, Вы получите их более
удобное представление. Этим приемом можно поль
зоваться  при графическом отображении и других
характеристик.
Таблица "Средние характеристики" содер
жит усредненные показатели предыдущих таблиц, а
также среднее арифметическое исходных данных.
Учитывая ярко выраженный характер динамики ис
33

¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
Протокол “Предварительный анализ данных”
 A
B
A
B
C
D
Средние характеристики
Статистики временного ряда   22014
Характеристика
Значение
Базисные характеристики
Среднее арифметическое
79,662
Наблюдение
Абс.
Темп
Темп
прирост
роста
прироста
Средний темп роста
100,452
Средний темп прироста
0,452
 4. 9. 95
0,520
100,688
0,688
Средний абсолютный прирост
0,356
 5. 9. 95
0,650
100,860
0,860
 7. 9. 95
0,700
100,926
0,926
Гипотеза об отсутствии тренда
 8. 9. 95
1,450
101,918
1,918
Метод проверки
Результат
 11. 9. 95
1,860
102,460
2,460
Метод Форстера Стюарта
   Нет
 12. 9. 95
2,500
103,307
3,307
Метод сравнения средних
   Нет
 14. 9. 95
3,900
105,159
5,159
Вывод: отвергается
 15. 9. 95
5,400
107,143
7,143
 18. 9. 95
5,510
107,288
7,288
Проверка однородности данных
 19. 9. 95
5,615
107,427
7,427
Номер на
Факт
Расчет
Новое
блюдения
значение
 21. 9. 95
5,600
107,407
7,407
 22. 9. 95
5,950
107,870
7,870
11
80,660
81,215
81,215
 25. 9. 95
6,100
108,069
8,069
15
80,700
81,805
81,805
 26. 9. 95
6,205
108,208
8,208
Обнаружены аномальные наблюдения!
 28. 9. 95
6,370
108,426
8,426
Автокорреляционная функция
 29. 9. 95
6,400
108,466
8,466
Лаг
Исходный
Разностный
 2. 10. 95
6,050
108,003
8,003
ряд
ряд (d=1)
 3. 10. 95
6,400
108,466
8,466
1
0,869
0,449
Цепные характеристики
2
0,730
0,058
Наблюдение
Абс.
Темп
Темп
3
0,565
0,020
прирост
роста
прироста
4
0,380
0,018
 4. 9. 95
0,520
100,688
0,688
5
0,206
0,199
 5. 9. 95
0,130
100,171
0,171
Стандартное отклонение = +0.4916,+0.2800
 7. 9. 95
0,050
100,066
0,066
Частная автокорреляционная функция
 8. 9. 95
0,750
100,983
0,983
Лаг
Исходный
Разностный
 11. 9. 95
0,410
100,532
0,532
ряд
ряд (d=1)
 12. 9. 95
0,640
100,826
0,826
1
0,890
0,536
 14. 9. 95
1,400
101,793
1,793
2
0,091
0,216
 15. 9. 95
1,500
101,887
1,887
3
0,002
0,079
 18. 9. 95
0,110
100,136
0,136
4
0,123
0,042
 19. 9. 95
0,105
100,129
0,129
5
0,074
0,209
 21. 9. 95
0,015
99,982
0,018
Стандартное отклонение = +0.2294,+0.2425
 22. 9. 95
0,350
100,431
0,431
 25. 9. 95
0,150
100,184
0,184
 26. 9. 95
0,105
100,129
0,129
 28. 9. 95
0,165
100,202
0,202
 29. 9. 95
0,030
100,037
0,037
 2. 10. 95
0,350
99,573
0,427
 3. 10. 95
0,350
100,429
0,429
34





¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Прогнозирование временных рядов
Назначение статистических методов прогно
зирования состоит в том, чтобы на основе математи
ческой модели сформировать точечный и интерваль
ный прогнозы исследуемого показателя, охарактери
зовав в доступной для пользователя форме степень
доверия к полученным результатам.
Продолжим обработку показателя цены ГКО
22014, который был ранее исследован на этапе
предварительного анализа, с целью выявить законо
мерности его изменения и получить прогнозные
оценки на три шага (торговых дня) вперед. Довери
тельный интервал прогноза сформируем для уровня
вероятности 80%. С учетом результатов предвари
тельного анализа, подтвердившего, в частности, на
личие тенденции, используем весь математический
аппарат, эффективность которого предварительно
проверим при помощи ретропрогноза на глубину в
три торговых дня.
Для этого выполните все действия вплоть до
появления диалога “Обработка временных рядов”,
таким же способом, как и на предыдущем этапе об
работки данных (см. раздел 1.7.2). Выберите на этот
раз этап “Построение моделей и прогнозирование”,
после чего появится соответствующее диалоговое
окно.
В этом окне во многих случаях можно сразу же
нажать кнопку "Вычислить" и через непродолжитель
ное время получить хорошие результаты. Однако
программа в этом случае выполнит расчеты не в пол
ную силу. Поэтому выполните следующие действия.
В блоке “Классы моделей”, прежде всего,
добьемся появления символа выбора “крестик” ря
дом со всеми наименованиями классов. Далее кон
кретизируем перечень моделей каждого класса. Для
этого необходимо воспользоваться кнопкой
“Параметры”.  Для моделей кривых роста и адаптив
ных методов установка параметров сводится к указа
нию состава моделей (по умолчанию программа ис
пользует не все модели), а для методов Бокса
Дженкинса и “ОЛИМП” их установка заключается в
задании пределов изменения параметров модели.
Совет. При первоначальной обработке иссле
дуемого показателя, целесообразно выбирать все
классы моделей, а в них все имеющиеся модели. Это

35




¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
несколько увеличит время вычислений, но позволит
построения такой модели является ее идентифика
быстро сформировать круг достаточно надежных
ция, т. е. определение числовых значений трех ука
моделей.
занных параметров.  Как показывает практика, наи
Для задания кривых роста воспользуйтесь
более действенным путем решения этой задачи яв
кнопкой “Параметры 1”, после нажатия которой по
ляется перебор всех возможных моделей. Если Вы
является диалоговое окно “Формирование набора
располагаете временем и достаточно быстродейст
моделей”. Зададим все модели кривых роста, кроме
вующей ПЭВМ, можно поручить программе просмот
полинома, который для целей прогнозирования под
реть весь диапазон возможных моделей в пределах
ходит плохо. Для выбора моделей в группе
от (0,0,1) до (5,2,5). Однако следует помнить, что бо
“Добавить“ воспользуйтесь кнопкой “Все” (все моде
лее сложные модели обычно имеют лучшие аппрок
ли перейдут из списка доступных в список  выбран
симирующие свойства, но вместе с тем обладают
ных моделей), а затем в списке “Выбранные пере
меньшей устойчивостью, что для прогнозирования
менные” установите курсор на строку “Y = полином” и
является определяющим отрицательным фактором.
нажмите “мышку” (модель “полином” удалится из
В большинстве случаев порядок параметров  p, d, q
списка выбранных и вернется в список доступных
не превышает трех. Среди моделей Бокса Дженкин
переменных). Для выхода из диалога воспользуйтесь
са построим модели, имеющие параметры авторег
кнопкой “Вычислить”.
рессии в интервале от нуля до 3, разностный опера
тор – от 1 до 2, оператор скользящего среднего   от 1
до 3. Для задания этих установок воспользуемся
кнопкой "Параметры".
Программа переспросит, действительно  ли
Вы  хотите  участвовать  в процессе  идентификации
модели, и в случае  положительного  ответа  появля
ется диалоговое окно "Идентификация модели Бокса
 Дженкинса".  При помощи спинеров, расположен
ных справа от параметров, выполните намеченные
установки и нажмите кнопку “Вычислить”.
Примечание 1. Для данных, содержащих цик
лическую или сезонную компоненту, дополнительно
указываются три аналогичных параметра. Если пери
од сезонности для обрабатываемых данных в диало
говом окне “Обработка временных рядов” был указан
“1”, то блок установки параметров сезонных опера
торов заблокирован.
Примечание 2.  Если начальное значение опе
раторов будет задано больше конечного, программа
Примечание. Если Вы выйдете из диалога, не выбрав
устранит это несоответствие, установив конечное
ни одной модели, программа воспользуется списком
значение параметра равным его начальному значе
моделей, которые установлены по умолчанию.
нию.
Формирование набора адаптивных методов
Формирование набора моделей ОЛИМП
осуществляется аналогично, после нажатия соответ
происходит аналогично после нажатия соответст
ствующей кнопки “Параметры 2”, с той лишь разни
вующей кнопки “Параметры 4”. Метод ОЛИМП для
цей, что список доступных переменных содержит три
отражения особенностей развития показателя стро
модели.
ит модель АРСС(p,q,d) порядка “p”  и скользящего
Метод Бокса   Дженкинса для отражения
среднего порядка “q”, но непосредственно для ис
особенностей развития показателя строит   модель
ходного ряда наблюдений. Поэтому порядок разно
авторегрессии AP(p) порядка “p” и (или) скользящего
стного оператора d=0. В большинстве случаев поря
среднего СС(q) порядка q для ряда наблюдений, по
док параметров p и q  не превышает четырех. Уста
лученного из исходного путем устранения тренда
новим параметры авторегрессии в интервале от нуля
применением разностного оператора порядка d. Та
до 4, оператор скользящего среднего – от 1 до 4.
ким образом, в общем случае строится  интегриро
На этом завершается определение круга зака
ванная модель АРиСС (p ,d ,q). Основной сложностью
занных моделей.
36

¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Далее установим "Тип прогноза". С целью про
Функция
Критерий
Эластич
верки эффективности математического аппарата
ность
выберите пункт "Ретропрогноз". Параметр "Период
Y(t)= +80.793*exp(
2,981
0,011
ретропрогнозирования" определяет количество то
0.094/t)
чек проверочной последовательности (она должна
Y(t)= +77.480+0.002*t**2
1,236
0,003
быть не менее двух точек). Установим при помощи
Y(t)=
4199,821
0,000
спинера период ретропрогноза 3 шага.
(+3.726)*((+1.735**(+1.12
Доверительная вероятность прогноза пер
7)**t))
воначально задана уровнем 80%. Его можно изме
Y(t)=
6,914
0,000
нить при помощи рядом стоящего спинера. Следует
(+79.364)/(+22.466*exp(
22.420*t))
помнить, что при увеличении этой величины, ширина
прогнозного интервала увеличивается, и слишком
Выбрана функция
Y(t)=(+74.190)*(+1.010)**t*(+1.000)**(t*t)

большое его значение (90% и выше) обычно приво
дит к потере информационной ценности прогноза.
Характеристики базы моделей
Далее определим параметр в блоке "Способ
Модель
Адекват
Точность
Качество
построения прогноза". Прогнозные оценки можно
ность
получить двумя альтернативными способами: как
прогноз по лучшей модели либо  используя построе
ОЛИМП(4,1)
99,943
96,972
97,715
ние обобщенного прогноза на основе нескольких
Метод Брау
98,753
96,178
96,822
"хороших". Каждый из этих подходов имеет свои дос
на(+0.106)
тоинства, однако не является заведомо лучше друго
ОЛИМП(2,4)
99,994
97,600
98,199
го, и потому, в большинстве случаев, их целесооб
ОЛИМП(2,3)
95,100
96,679
96,284
разно использовать совместно. Выберем режим по
АРИСС(2,2,1)
99,843
95,910
96,893
лучения прогноза “На основе лучшей модели”.
Полнота выдачи результатов вычислений оп
АРИСС(0,1,1)
96,626
96,415
96,468
ределяется перечнем таблиц, заказанных в блоке
АРИСС(0,1,2)
99,600
96,314
97,136
“Структура отчета”. Количество заказанных таблиц
АРИСС(0,1,3)
99,973
96,119
97,083
практически не влияет на время формирования отче
та. Поэтому имеет смысл заказать все перечислен
ОЛИМП(3,1)
98,828
96,538
97,110
ные таблицы (поставить рядом с ними символ выбо
АРИСС(0,2,2)
99,013
97,011
97,512
ра   крестик).  Это состояние уже зафиксировано.
АРИСС(0,2,3)
98,333
96,198
96,731
Для начала расчетов следует нажать на кнопку
АРИСС(1,1,1)
99,904
96,287
97,191
“Вычислить”.
Протокол ретропрогноза
ОЛИМП(4,3)
94,689
97,235
96,598
A
B
C
D
АРИСС(1,1,3)
99,945
96,191
97,129
Модели временного ряда   22014
ОЛИМП(1,4)
98,335
97,420
97,649
Таблица кривых роста
ОЛИМП(2,2)
100,000
96,439
97,330
Функция
Критерий
Эластич
ность
АРИСС(1,2,3)
99,477
96,183
97,007
Y(t)=+75.058+0.493*t
0,509
0,053
АРИСС(2,1,1)
99,981
96,215
97,157
Y(t)=+74.122+0.805*t 
0,401
0,053
АРИСС(2,1,2)
99,635
96,196
97,056
0.018*t*t
АРИСС(2,1,3)
99,945
96,169
97,113
Y(t)=+80.799 7.351/t
3,046
0,011
Лучшая модель ОЛИМП(2,4)
Y(t)=1./(+0.013 0.0000*t)
0,562
0,053
Y(t)=1./(+0.013+0.002*ex
4,277
0,000
Параметры моделей
p( t))
Мо
a1
a2
a3
a4
a5
a6
Y(t)=
0,534
0,053
дель
+75.117*exp(+0.006*t)
ОЛИМ
0,863
0,007
0,014
0,711
0,796
0,086
Y(t)= +73.782+2.850*ln(t)
0,984
0,036
П(2,4)
Y(t)=
0,392
0,000
(+74.190)*(+1.010)**t*(+1
Таблица остатков
.000)**(t*t)
Номер
Факт
Расчет
Ошибка
Ошибка
Y(t)=
0,534
0,053
абс.
относит.
(+75.117)*(+1.006)**t
 8.9.95
77,050
76,818
0,232
0,300
Y(t)=0+0/ln(t)
  Нет
0,000
11.9.95
77,460
77,044
0,416
0,538
Y(t)=
0,931
0,036
(+73.900)*t**(+0.036)
12.9.95
78,100
77,871
0,229
0,293
Y(t)=
0,501
0,050
14.9.95
79,500
79,836
0,336
0,422
+73.438+0.233*t+1.376*s
qr(t)
15.9.95
81,000
81,496
0,496
0,613
Y(t)= t/(+0.004+0.012*t)
11,120
0,034
18.9.95
81,110
80,807
0,303
0,373
19.9.95
81,215
81,530
0,315
0,388
37


¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
Номер
Факт
Расчет
Ошибка
Ошибка
абс.
относит.
21.9.95
81,200
81,113
0,087
0,107
22.9.95
81,550
81,638
0,088
0,108
25.9.95
81,700
81,745
0,045
0,055
26.9.95
81,805
81,717
0,088
0,107
28.9.95
81,970
82,021
0,051
0,062
Характеристики остатков
Характеристика
Значение
Среднее значение
0,002
Оценка дисперсии
0,071
Приведенная дисперсия
0,086
Средний модуль остатков
0,224
Относительная ошибка
0,281
Критерий Дарбина Уотсона
2,005
Àïïðîêñèìàöèÿ è Ðåòðîïðîãíîç
Коэффициент детерминации
1,000
84
F   значение ( n1 =   1, n2 =  10)
100000,000
83
Критерий адекватности
99,994
82
Âåðõíÿÿ
ãðàíèöà
81
Ïðîãíîç
Критерий точности
97,600
80
Íèæíÿÿ
Критерий качества
98,199
79
ãðàíèöà
Ôàêò
78
Уравнение значимо с вероятностью 0.95
77
Таблица ретро прогнозов (p = 80%)
76
Упреж
Факт
Прогно Нижня Верхня
Абс.
Отн.
1
2
3
дение
з
я
я
откл
откл
границ границ
ние
ние
 8.9.95
 11.9.95
 12.9.95
 14.9.95
 15.9.95
 18.9.95
 19.9.95
 21.9.95
 22.9.95
 25.9.95
 26.9.95
 28.9.95
а
а
1
82,000 82,153 81,663 82,643
0,153
0,186
Àáñîëþòíàÿ îøèáêà
2
81,650 82,334 81,409 83,259
0,684
0,838
3
82,000 82,435 81,251 83,619
0,435
0,531
0,500
0,400
0,300
Таблица характеристик ретро прогнозов
0,200
Характеристика
Абсолют.
Относит.
0,100
значение
значение(%)
0,000
Среднее значе
0,424
0,519
1
2
3
4
5
6
7
8
9
10
11
12
-0,100
ние
-0,200
Среднеквадратич
0,217
0,266
-0,300
еское откл
-0,400
Средний модуль
0,424
0,519
-0,500
ошибки
Максимальное
0,153
0,186
отклонение
Îòíîñèòåëüíàÿ îøèáêà %
Минимальное
0,684
0,838
отклонение
0,600
0,400
0,200
0,000
1
2
3
4
5
6
7
8
9
10
11
12
-0,200
-0,400
-0,600
-0,800
После этого появится заставка, внутри которой
содержится сообщение о выполнении программой
соответствующих этапов. Результаты обработки ото
38

¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
бражаются в протоколе “Модели временного ряда”
имеющей идентификатор "а" с порядковым номером,
(см. выше).
содержится значение коэффициентов моделей, при
Таблица "Моделей кривых роста" содержит:
чем для параметрических моделей сначала приво
• математический вид функции с числовыми
дятся значения всех "p" коэффициентов авторегрес
значениями параметров;
сии, а затем "q" коэффициентов скользящего сред
• значение критерия точности, в качестве кото
него. Если возникает необходимость узнать более
рого выступает сумма квадратов отклонений расчет
точное значение коэффициентов модели, чем с тре
ных данных от фактических;
мя знаками в дробной части, достаточно установить
• значение коэффициента эластичности.
курсор на клетку, содержащую значение интересую
В последней строке таблицы содержится мо
щего параметра, и посмотреть в строку формул.
дель, которая является лучшей (имеет минимальное
Примечание. В случае формирования обоб
значение критерия). В случае если количество зака
щенного прогноза, после параметров моделей фор
занных моделей больше трех, на основе показателя
мируется графа "Вес моделей". Весовые коэффици
"Критерий" строится график.
енты в сумме дают единицу и показывают степень
Таблица "Характеристики базы моделей"
влияния каждой модели на обобщенный прогноз.
содержит:
Таблица "Характеристика остатков" содер
• математический вид моделей  с числовыми
жит наименование показателя и его числовое значе
значениями параметров;
ние. В последней строке приведен вывод относи
• значение интегрированного критерия адек
тельно значимости построенной модели. Если мо
ватности;
дель незначима или имеет низкое значение критерия
• значение интегрированного критерия точно
качества (его значение в этом случае окрашивается в
сти;
красный цвет), использовать ее для прогнозирования
• значение интегрированного критерия качест
нельзя! В нашем примере построенная лучшая мо
ва.
дель  является значимой и имеет высокий уровень
База моделей, представленная в таблице, со
качества 98.2.
держит не более 20 моделей, включающих в себя
Таблица остатков  содержит пять граф:
одну лучшую по критерию точности из построенных
• имя переменной (в статистических таблицах
моделей кривых роста, а также заказанные адаптив
она обычно выражается датой или порядковым но
ные модели, модели Бокса Дженкинса и модели
мером наблюдений);
ОЛИМП. Если рассчитываются более 20 моделей, то
• фактическое значение (исходные данные в
худшие из них вытесняются из базы моделей.
Вашей таблице);
 Для адаптивных моделей Брауна и Хольта в
• расчетное значение по модели;
скобках приводятся значения параметров адаптации,
• абсолютное отклонение расчетных уровней от
найденных в результате оптимизации. Для авторег
фактических (факт минус расчет);
рессионой модели AP(p,d) указывается порядок ав
• относительное отклонение (факт минус рас
торегрессии и разностного оператора.
чет, деленное на фактическое значение и умножен
Модели Бокса Дженкинса идентифицированы
ное на 100%).
как АРиСС(p,d,q) ((p,d,q)X(ps,ds,qs) для сезонных
В динамических рядах наиболее важным явля
процессов), а модели ОЛИМП как (p,q)
ется правильность отображения исследуемого пока
((p,q)x(ps,qs) для сезонных процессов). Числовые
зателя на последнем участке наблюдения. Поэтому, в
значения параметров этих моделей можно увидеть в
качестве дополнительной информации для оценки
таблице параметров.
точности модели, целесообразно привлекать вели
 Методика оценки адекватности, точности и
чину ошибок аппроксимации на конце периода на
качества модели описана в разделе “Качество моде
блюдения. В нашем примере пять последних уровней
ли”. В последней строке таблицы содержится мо
относительных отклонений существенно меньше
дель, которая является лучшей по критерию качест
средней относительной ошибки аппроксимации, со
ва. В нашем случае почти все модели имеют высокое
ставляющей 0.28%. Для лучшего восприятия резуль
качество, что особенно заметно на трех графиках к
татов, для наблюдений, которые отличаются от рас
данной таблице, но чуть лучше других оказалась мо
четных значений более чем на 10%, величина относи
дель ОЛИМП (2,4).
тельной ошибки выделяется красным цветом.
 В случае если количество заказанных моделей
 Для двух последних граф таблицы сформиро
больше трех, на основе трех последних показателей
ваны графики.
строятся соответствующие графики.
Таблица "Ретропрогноз" содержит:
Таблица "Параметры моделей" содержит:
• номер наблюдения на периоде прогнозиро
• вид или наименование модели;
вания;
• числовые оценки параметров модели;
• точечное прогнозное значение, полученное
• веса моделей (только для обобщенного про
по модели;
гноза).
• нижнюю и верхнюю оценку доверительного
В таблицу из базы моделей включаются либо
интервала прогноза;
одна лучшая модель (по критерию качества), либо
• абсолютное отклонение расчетных данных от
несколько (до четырех) моделей, если было заказано
фактических значений;
построение обобщенной модели. В каждой графе,
39


¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
• относительное отклонение (в %) расчетных
протоколе, в отличие от приведенного выше, нет таб
данных от фактических значений.
лиц характеристик ретропрогноза и параметров кри
Ретропрогноз вместе со значениями таблицы
вых роста, но есть таблица "Прогнозные оценки",
остатков отражаются на графике "Аппроксимация и
которая содержит: номер наблюдения на периоде
ретропрогноз".
прогнозирования;  точечное прогнозное значение,
На графике ретропрогноза видно, что расчет
полученное по модели;  нижнюю и верхнюю оценку
ные значения оказались достаточно близки к факти
доверительного интервала прогноза. Эти значения
ческим, причем все фактические данные попали в
вместе со значениями таблицы остатков отражаются
доверительный интервал прогноза. В этой связи вос
на графике "Аппроксимация и прогноз", вид которого
пользуемся построенной моделью для получения
идентичен аналогичному графику, полученному в ре
реального прогноза.
жиме ретропрогноза.
Таблица "Характеристики ретропрогноза"
Протокол прогнозирования по лучшей модели
содержит наименование показателя и его числовое
A
B
C
D
значение, вычисленное для абсолютных  и относи
Модели временного ряда   22014
тельных отклонений. Все характеристики (среднее
Характеристики базы моделей
значение, СКО, среднее по модулю, максимальное и
Модель
Адекватност
Точность
Качество
минимальное отклонение) вычисляются аналогично
ь
характеристикам периода аппроксимации с той лишь
ОЛИМП(2,4)
53,614
97,421
86,469
разницей, что в качестве исходных данных берется
отклонение прогнозных значений от фактических.
Лучшая модель ОЛИМП(2,4)
Итак, построенная модель имеет достаточно
Параметры моделей
высокие статистические свойства на участке аппрок
Модель
a1
a2
a3
a4
a5
a6
симации и ретропрогноза, и можно перейти к полу
ОЛИМП
0,487
0,412
0,999
0,357
0,119
0,212
чению на ее основе прогнозных оценок на период
(2,4)
после 9.09.95. Для этого повторим все действия опи
санные выше вплоть до выхода в диалоговое окно
Таблица остатков
"Построение модели и прогнозирование". Далее в
Номер
Факт
Расчет
Ошибка
Ошибка
первых трех классах моделей уберем признак выбо
абс.
относит.
ра “крестик” и нажмем кнопку  "Параметры 4", соот
 8.9.95
77,050
76,881
0,169
0,220
ветствующую методу ОЛИМП. После этого появится
 11.9.95
77,460
77,491
0,031
0,040
диалоговое окно "Параметры ОЛИМПа".
 12.9.95
78,100
78,006
0,094
0,120
 14.9.95
79,500
80,536
1,036
1,304
 15.9.95
81,000
81,443
0,443
0,547
 18.9.95
81,110
81,293
0,183
0,225
 19.9.95
81,215
80,793
0,422
0,520
 21.9.95
81,200
81,029
0,171
0,211
 22.9.95
81,550
81,390
0,160
0,196
 25.9.95
81,700
81,716
0,016
0,019
 26.9.95
81,805
81,628
0,177
0,217
 28.9.95
81,970
82,044
0,074
0,090
 29.9.95
82,000
81,647
0,353
0,431
 2.10.95
81,650
81,358
0,292
0,358
В нем сделаем установки параметров, которые
 3.10.95
82,000
82,024
0,024
0,029
соответствуют структуре построенной в режиме ре
Характеристики остатков
тропрогнозирования лучшей модели: р=2, q=4
Характеристика
Значение
(нижняя и верхняя граница у этих параметров одина
Среднее значение
0,002
кова). В блоке "Тип прогноза" установим переключа
Оценка дисперсии
0,122
тель на "Прогноз вперед". Период прогнозирования
Оценка приведенной дисперсии
0,140
определяется потребностями пользователя. Его пер
Средний модуль остатков
0,243
воначальное значение можно изменить при помощи
Относительная ошибка
0,302
рядом стоящего спинера. При задании этого пара
Критерий Дарбина Уотсона
1,442
метра и использовании результатов следует пом
Коэффициент детерминации
1,000
нить, что все экстраполяционные модели исходят из
F   значение ( n1 =   1, n2 =  13)
100000,000
предположения о сохранении сложившихся законо
Критерий адекватности
53,614
мерностей на некотором участке будущего, однако
Критерий точности
97,421
его справедливость при большом горизонте прогно
Критерий качества
86,469
зирования в большинстве случаев сомнительна. По
Уравнение значимо с вероятностью 0.95
этому не  увлекайтесь дальними прогнозами!
Таблица прогнозов (p = 80%)
Вероятность свершения прогноза зададим в
Упреж
Прогноз
Нижняя
Верхняя
дение
граница
граница
80 процентов, а остальные параметры оставим без
1
82,296
81,598
82,995
изменения. После нажатия кнопки “Вычислить" через
2
82,381
81,503
83,258
непродолжительное время появится протокол ре
3
82,599
81,569
83,628
зультатов вычислений, приведенный ниже. В этом
40





¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Программа  сообщит,  что  последние    столб
цы выделенных   строк   являются   пустыми,  и   за
просит   разрешения  не   использовать  их. Ответьте
Корреляционный анализ
на   этот   запрос   утвердительно,   после   чего  поя
Корреляционный анализ предназначен для
вится   диалоговое  окно "Корреляционный анализ".
измерения степени связи двух или более перемен
ных, отбор факторов, оказывающих наиболее суще
ственное влияние на результативный признак и об
наружения ранее неизвестных причинных связей.
Для иллюстрации возможностей корреляци
онного анализа исследуем взаимосвязь показателя
“Индекс потребительских цен” от других приведен
ных во второй таблице показателей (см. фрагмент
таблицы данных на рисунке). Активизируйте вторую
таблицу демонстрационного файла Demo.xls и выде
лите с третьей по десятую строки. Таким образом,
выделенный блок кроме числовых данных будет со
держать наименования переменных, но не будет
иметь наименования таблицы и наблюдений.
Для оценки взаимосвязи индекса оптовых цен
с другими факторами необходимо  определить набор
не менее чем из двух переменных.  Для этого в
"Списке доступных переменных" установите курсор
на  строку “Индекс потребительских цен” и щелкните
"мышкой". Указанная переменная будет перенесена
в правое окно "Список выбранных переменных". Та
ким же способом  закажите переменные “Индекс оп
товых цен”, “Объем промышленного производства”,
“Импорт”.
Структура отчета зависит от сделанного выбо
ра пунктов: в отчет попадут таблицы, рядом с кото
рыми стоит символ “крестик”. Суть всех коэффици
ентов и формулы расчета  описаны во втором разде
ле.
Для начала расчетов нажмите на кнопку
“Вычислить”.
Установите курсор на пункт меню “СтатЭкс”,
После этого появится заставка, внутри которой
нажмите “мышку” и в появившемся меню выберите
содержится сообщение о выполнении программой
пункт “Корреляция”.
соответствующих этапов. Результаты обработки ото
В появившемся диалоговом окне “Установка
бражаются в Протоколе "Корреляционный  анализ",
блока данных” в блоке “Ориентация таблицы” уста
который содержит 5 таблиц:
новите параметр “По строкам”, отмените указатель
• Парные коэффициенты корреляции;
наименований таблицы и наблюдений, а указатель
• Оптимальные лаги корреляции;
наличия наименования переменных оставьте без из
• Парные корреляции на оптимальных лагах;
менения, (см. рисунок) после чего воспользуйтесь
• Частные коэффициенты корреляции;
кнопкой “Установить”.
• Множественные коэффициенты корреляции.
На основе этих коэффициентов с различных
позиций можно судить о степени взаимосвязи пере
менных. При этом позиция коэффициентов (номер
41

¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
строки и номер столбца) определяет между какими
Импорт
0.461
0.627
0.965
1.000
переменными оценивается связь. Номер строки ха
(C.I.F.),
рактеризует первую переменную, а номер столбца 
млрд. руб.
вторую.
Критическое значение на уровне 90 при 2 степенях
В таблицах парных и частных коэффициентов
свободы = +0.2717
корреляции красным цветом выделены незначимые
Матрица максимальных корреляций
коэффициенты, значение которых по абсолютной
Переменная
Индекс
Индекс
Объем
Импорт
потребит
оптовых промышл
(C.I.F.),
величине меньше порогового уровня. Пороговый
ельских
цен
енного
млрд.
уровень значимости, указанный в нижней строке этих
цен
произ
руб.
таблиц, вычисляется исходя из заданного пользова
водства,
телем уровня отбора. Для первой переменной стро
млрд.
ится график парного и частного коэффициентов с
руб.
остальными переменными.
Индекс по
1.000
0.926
0.562
0.461
Таблица "Оптимальные лаги корреляции" со
требительск
держит оценку лага (сдвига, запаздывания)  при ко
их цен
тором связь между двумя переменными максималь
Индекс оп
0.926
1.000
0.681
0.627
на. Таблица "Парные корреляции на оптимальных
товых цен
Объем про
0.562
0.681
1.000
0.965
лагах" отличается от таблицы парных корреляций,
мышленного
если между хотя бы одной из пар переменных опти
произ
мальный лаг больше нуля. Оценки этих таблиц важны
водства,
при построении регрессионных моделей. В нашем
млрд. руб.
Импорт
0.461
0.627
0.965
1.000
примере все оптимальные корреляционные лаги
(C.I.F.),
равны нулю и, следовательно, построение регресси
млрд. руб.
онных зависимостей следует проводить по исходным
Матрица оптимальных лагов
данным. Если провести корреляционный анализ по
Переменная
Индекс
Индекс
Объем
Импорт
данным ГКО можно обнаружить, что наиболее силь
потребит
оптовых промышл
(C.I.F.),
ная связь между многими выпусками проявляется на
ельских
цен
енного
млрд.
лаге 1, т.е. со сдвигом в один торговый день. Следо
цен
произ
руб.
водства,
вательно, в этом случае один выпуск ГКО по отноше
млрд.
нию к другому можно рассматривать как событие
руб.
предвестник, индикатор рынка.
  Индекс по
0.000
0.000
0.000
0.000
В случае невозможности вычисления этих ко
требительск
эффициентов, например, из за вырожденности мат
их цен
риц, в протоколе появляется соответствующее со
  Индекс оп
0.000
0.000
0.000
0.000
общение.
товых цен
Примечание.  Применение корреляционного
  Объем
0.000
0.000
0.000
0.000
анализа более эффективно при обработке не исход
промышлен
ных временных рядов, а их остаточных компонент,
ного произ
водства,
полученных в результате исключения тренда из ис
млрд. руб.
ходных данных. Поэтому перед запуском корреляци
  Импорт
0.000
0.000
0.000
0.000
онного анализа целесообразно  для каждого иссле
(C.I.F.),
дуемого показателя воспользоваться режимом про
млрд. руб.
гнозирования.
Матрица частных корреляций
Переменная
Индекс
Индекс
Объем
Импорт
A
B
C
D
E
потребит
оптовых промышл
(C.I.F.),
Протокол корреляционного анализа
ельских
цен
енного
млрд.
Матрица парных корреляций
цен
произ
руб.
Переменная
Индекс
Индекс
Объем
Импорт
водства,
потребит
оптовых промышл
(C.I.F.),
млрд.
ельских
цен
енного
млрд.
руб.
цен
произ
руб.
  Индекс по
1.000
0.915
0.444
0.534
водства,
требительск
млрд.
их цен
руб.
  Индекс оп
0.915
1.000
0.272
0.434
Индекс по
1.000
0.926
0.562
0.461
товых цен
требительск
  Объем
0.444
0.272
1.000
0.952
их цен
промышлен
Индекс оп
0.926
1.000
0.681
0.627
ного произ
товых цен
водства,
Объем про
0.562
0.681
1.000
0.965
млрд. руб.
мышленного
  Импорт
0.534
0.434
0.952
1.000
произ
(C.I.F.),
водства,
млрд. руб.
млрд. руб.
42



¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Критическое значение на уровне 90 при 4 степенях
ются   пустыми,  и   запросит   разрешения  не   ис
свободы = +0.2725
пользовать  их. Ответьте   на   этот   запрос   утверди
Ïàðíûå êîððåëÿöèè ïåðåìåííîé 1
тельно,   после   чего  появится   диалоговое  окно
"Регрессионный анализ".
1,000
Модель регрессии включает зависимую и, по
0,800
крайней мере, одну независимую переменную. По
0,600
этому, прежде всего, необходимо определить набор
0,400
не менее чем из двух переменных. Выберите те же
0,200
переменные, что и при проведении корреляционного
0,000
анализа.   Для этого в "Списке доступных перемен
1
2
3
4
-0,200
ных" установите курсор на  строку “Индекс потреби
-0,400
тельских цен” и щелкните "мышкой". Указанная пе
-0,600
ременная будет перенесена в правое окно "Список
Íîìåð ïåðåìåííîé
выбранных переменных". Таким же способом  зака
жите переменные “Индекс оптовых цен”, “Объем
промышленного производства”, “Импорт”.
×àñòíûå êîððåëÿöèè ïåðåìåííîé 1
1,000
0,800
0,600
0,400
0,200
0,000
1
2
3
4
-0,200
-0,400
-0,600
Íîìåð ïåðåìåííîé
Регрессионный анализ
Регрессионной анализ предназначен для ис
Далее в списке выбранных переменных следу
следования зависимости исследуемой переменной
ет  указать зависимую переменную. Для этого на
от различных факторов и отображения их взаимосвя
жмите кнопку "Выбор", в появившемся окне устано
зи в форме регрессионной модели.
вите курсор на “Индекс потребительских цен”,  а за
Для иллюстрации возможностей регрессион
тем нажмите кнопку “Выход”.
ного анализа исследуем взаимосвязь показателя
“Индекс потребительских цен” от  показателей, кото
рые были задействованы в корреляционном анализе.
Построим модель линейной, а так же парной регрес
сии и получим на их основе точечный и интервальный
прогнозы с доверительной вероятностью 85%. Для
оценки эффективности математического аппарата
воспользуемся техникой ретропрогнозирования, ос
тавив в качестве проверочного участка три последних
наблюдения.
Сначала активизируйте вторую таблицу (Лист
В поле "Зависимая переменная" вместо фразы
2) демонстрационного файла Demo.XLS (см. рисунок
"зависимая переменная не определена" появится
в разделе 1.7.4). Выделите в ней строки со второй по
наименование выбранной переменной. Ее наимено
десятую включительно, т.е. в блоке данных будут
вание удаляется из списка выбранных переменных.
присутствовать наименования наблюдений (даты) и
Все остальные выбранные переменные считаются
наименования переменных (показателей), но не бу
независимыми, т.е. факторами.
дет наименования таблицы.
На основе регрессионной модели можно изу
Далее установите курсор на пункт меню
чать взаимосвязь исследуемых показателей. Этот
“СтатЭкс”, нажмите кнопку “мыши” и в появившемся
режим включен по умолчанию. На ее основе можно
меню выберите пункт “Регрессия”.
получать также прогнозные оценки.  Для этого  зака
В  диалоговом окне “Установка блока данных”
жите пункт "Прогнозирование по модели" и   выбери
(см. рисунок в разделе 1.7.4) в блоке “Ориентация
те пункт "ретропрогноз". Параметр "Период ретро
таблицы” установите параметр “По строкам”, отме
прогнозирования" определяет количество точек про
ните указатель наличия наименования таблицы, а
верочной последовательности, которая должна быть
указатель наличия наименования наблюдений и пе
не менее двух точек. При помощи спинера установим
ременных оставьте без изменения.  Далее нажмите
цифру “3”.
кнопку “Установить”. Программа  сообщит,  что  по
следние     столбцы (231) выделенных   строк   явля
43



¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
Примечание. При отключенном параметре
• среднеквадратическое отклонение;
"Ретропрогноз" программа находится в режиме про
• t значение (статистика Стьюдента для оценки
гнозирования. Чтобы получить правильный результат
значимости коэффициентов модели);
сначала сформируйте прогнозы всех включенных в
• нижняя и верхняя оценка значений коэффи
нее факторов, потом запишите результаты в таблицу
циентов;
исходных данных (у зависимой переменной про
• коэффициенты эластичности, бета
ставьте нулевые числовые значения). Затем снова
коэффициенты и дельта коэффициенты (см. раздел
войдите в режим регрессии и включите режим про
“Коэффициенты экономической интерпретации”).
гнозирования, установив символ "крестик" рядом с
В последней строке приведено критическое
параметром "Прогнозирование по модели", и отклю
значение t критерия, ниже которого коэффициенты
чите параметр "Ретропрогноз".
модели считаются незначимыми. В таблице они вы
Вероятность свершения прогноза первона
делены красным цветом. Как правило, такую модель
чально задана уровнем 80%.  Измените ее величину
можно упростить, отбросив незначимые факторы.
на 85% при помощи рядом стоящего спинера.
“Таблица остатков”, таблицы "Характеристика
Полнота выдачи результатов вычислений оп
остатков", "Ретропрогноз",  "Характеристики ретро
ределяется перечнем заказанных в блоке “Структура
прогноза", а также графики расхождений фактиче
отчета” таблиц. Количество заказанных таблиц прак
ских и расчетных значений  полностью совпадают с
тически не влияет на время формирования отчета.
аналогичными таблицами, которые описаны в разде
Закажите все перечисленные таблицы (поставить
ле “Временные ряды”.
рядом с ними символ выбора   крестик) и графики.
На рисунке приведены результаты ретропрог
На последнем шаге следует определить вид
нозирования, из которых следует, что, несмотря на
модели регрессии и способ ее построения, т.е. вы
заметное изменение поведения исследуемого пока
брать одну из четырех возможностей:
зателя, его значение не вышло за пределы интер
• линейная множественная регрессия;
вального прогноза.
• пошаговая регрессия;
• гребневая регрессия;
Линейная регрессия:
• парная регрессия.
 Зависимая переменная     Индекс потребительских
Примечание. При неопределенных или непра
цен
Оценки коэффициентов линейной регрессии
вильно заданных параметрах, программа выдает со
Пере
Коэф
Ср.
t
Ниж
Верх
Элас
Бета
Дель
ответствующее сообщение и ждет исправления оши
мен
фици
кв.
знач.
няя
няя
ность коэф
та
бочного действия.
ная
ент
отк
оцен
оцен
т
коэф
Выберете первый пункт   “Линейная регрес
ие
ка
ка
т
сия” и нажмите на кнопку “Вычислить”. Программа
Св.
34,36 27,92
1,230 10,25 58,46
0,000 0,000 0,000
запросит разрешение подключить к выбранным фак
член
1
8
4
8
торам  параметр "Время". Ответьте на этот запрос
 Ин
0,713 0,208 3,434 0,534 0,893 0,720 0,736
отрицательно.
декс
4,169
оптов
Через непродолжительное время появится
ых
протокол регрессионного анализа, который пред
цен
ставлен ниже. Структура отчета видна из приводимых
 Объ
0,000 0,000
0,000
3,826
ем
2,277 0,001
0,063 0,676
ниже меню, доступ к которым осуществляется при
пром.
помощи пиктограмм таблицы “Report”.
про
ва.
  Им

0,001 0,001 0,877 0,000 0,002 0,039
1,343
порт
0,237
(C.I.F.
)

Критические значения t pаспpеделения пpи 17 степе
нях свободы (p=80) = +0.863
Таблица остатков

Номер
Факт
Расчет
Ошибка
Ошибка
абс
относит.
 1.1.93
125,800
128,140
2,340
1,860
 1.2.93
124,700
126,790
2,090
1,676
 1.3.93
120,100
121,434
1,334
1,110
 1.4.93
123,200
122,301
0,899
0,730
 1.5.93
118,500
119,489
0,989
0,834
 1.6.93
119,900
118,638
1,262
1,052
Таблица “Оценки коэффициентов линейной
 1.7.93
122,000
124,745
2,745
2,250
регрессии" содержит:
 1.8.93
126,000
122,806
3,194
2,535
• наименование переменной  (для A0 имя "Св.
 1.9.93
123,000
118,716
4,284
3,483
член");
• 
 1.10.93
120,000
116,734
3,266
2,722
коэффициент (параметры модели);
44



¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Номер
Факт
Расчет
Ошибка
Ошибка
Àïïðîêñèìàöèÿ è Ðåòðîïðîãíîç
абс
относит.
 1.11.93
116,000
114,708
1,292
1,114
130
 1.12.93
113,000
111,988
1,012
0,896
125
Âåðõíÿÿ
 1.1.94
117,900
115,796
2,104
1,785
120
ãðàíèöà
115
Ïðîãíîç
 1.2.94
110,700
113,753
3,053
2,758
110
Íèæíÿÿ
 1.3.94
107,400
109,240
1,840
1,714
ãðàíèöà
105
Ôàêò
 1.4.94
108,800
108,532
0,268
0,247
100
 1.5.94
108,100
107,307
0,793
0,734
95
2
 1.6.94
105,000
108,157
3,157
3,007
 1.7.94
105,000
107,010
2,010
1,914
 1.1.93
 1.3.93
 1.5.93
 1.7.93
 1.9.93
 1.1.94
 1.3.94
 1.5.94
 1.7.94
 1.9.94
 1.11.93
 1.8.94
104,000
104,483
0,483
0,465
Теперь построим модель парной регрессии,
 1.9.94
107,200
106,032
1,168
1,090
характеризующей зависимость индекса потреби
тельских цен от индекса оптовых цен. Для этого по
Характеристики остатков
вторите все действия, описанные в данном разделе
Характеристика
Значение
выше, но в диалоговом окне “Регрессионный анализ”
выберите лишь два указанных показателя.
Среднее значение
0,024
Оценка дисперсии
4,661
Оценка приведенной дисперсии
5,758
Средний модуль остатков
1,885
Относительная ошибка
1,618
Критерий Дарбина Уотсона
1,305
Коэффициент детерминации
1,000
F   значение (n1 =   3, n2 =  17)
16288,395
Критерий адекватности
38,050
Критерий точности
86,545
Критерий качества
74,421
Уравнение значимо с вероятностью 0.95
Таблица ретро прогнозов (p = 85%)

Окажитесь от режима прогнозирования,  а в
Упре
Факт
Прог
Ниж
Верх
Абс.
Отн.
блоке “Вид регрессии” выберите пункт “Парная рег
жде
ноз
няя
няя
Откло
Откло
рессия”. Конкретный перечень моделей можно
ние
границ границ
нение
нение
сформировать после нажатия кнопки “Вычислить”.
а
а
Для парной регрессии появляется диалоговое окно
1
115,00 108,18 101,64 114,71
6,818
5,929
выбора 16 регрессионных зависимостей.
0
2
9
5
2
114,00 108,90 100,14 117,66
5,095
4,469
0
5
5
5
3
116,00 108,44 95,649 121,24
7,552
6,510
0
8
8
Таблица характеристик ретро прогнозов
Характеристика
Абсолют.
Отно
значение
сит.
значе
ние%
Среднее значение
6,488
5,636
Среднеквадратическое откло
1,030
0,859
нение
Средний модуль ошибки

6,488
5,636
Максимальное отклонение
7,552
6,510
Для выбора всех регрессионных моделей в ок
Минимальное отклонение
5,095
4,469
не "Список доступных переменных"  в группе
“Добавить” нажмите на кнопку “Все”. Для выхода из
диалога “Формирование набора моделей” восполь
зуйтесь кнопкой "Выход". (Если Вы выйдете из диа
лога, не выбрав ни одной модели, программа вос
пользуется списком моделей, которые установлены
по умолчанию.).
45

¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
Через непродолжительное время появится
Номер
Факт
Расчет
протокол, представленный ниже.
 1. 4. 94
108,800
110,257
Для парной регрессии  все таблицы, за ис
 1. 5. 94
108,100
106,210
ключением первой, аналогичны описанным выше.
 1. 6. 94
105,000
107,612
Вместо нее выдается таблица "Функции парной рег
 1. 7. 94
105,000
107,612
рессии", которая содержит:
 1. 8. 94
104,000
104,754
• вид регрессионной модели с оцененными па
 1. 9. 94
107,200
106,210
раметрами;
 1. 10. 94
115,000
111,499
• значение критерия точности, по минимальной
 1. 11. 94
114,000
113,822
величине которого определяется лучшая модель;
 1. 12. 94
116,000
113,822
• значение коэффициента эластичности.
Характеристики остатков
В последней строке приводится лучшая мо
Характеристика
Значение
дель. Если было заказано построение более трех мо
Среднее значение
0,307
делей, на основе графы "Критерий" строится соот
Оценка дисперсии
4,738
ветствующий график (см. рисунок ниже).
Парная регрессия.
Оценка приведенной дисперсии
5,523
Y =   Индекс потребительских цен
Средний модуль остатков
1,784
X =   Индекс оптовых цен
Относительная ошибка аппроксимации
1,569
Таблица функций парной регрессии
Функция
Критерий
Эластич
Критерий Дарбина Уотсона
1,551
ность
Коэффициент детерминации
1,000
Y(X)=+18.621+0.831*X
7,447
0,839
F   значение (n1 =   2, n2 =  21)
29066,275
Y(X)= 352.893+7.152*X 
5,523
0,914
Критерий адекватности
66,799
0.027*X*X
Y(X)=0+0/X
  Нет
0,000
Критерий точности
86,937
Y(X)=1./(+0.016 0.0000*X)
8,729
0,839
Критерий качества
81,902
Y(X)=1/(0+0*exp( X))
  Нет
0,000
Уравнение значимо с вероятностью 0.95
Y(X)= +49.772*exp(+0.007*X)
8,020
0,840
Ñîîòíîøåíèå ìîäåëåé ïî
êðèòåðèþ
Y(X)=  353.172+98.545*ln(X)
6,871
0,852
300,000
Y(X)=
7,790
0,000
250,000
(+1.498)*(+1.069)**X*(+1.00
0)**(X*X)
200,000
Y(X)= (+49.772)*(+1.007)**X
8,020
0,840
150,000
Y(X)= +588.319
6,655
0,858
100,000
2248.424/ln(X)
50,000
Y(X)= (+1.974)*X**(+0.855)
7,372
0,855
0,000
Y(X)=  1424.050
299,465
0,898
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
11.314*X+266.385*sqr(X)
Ìîäåëü
Y(X)= X/(+0.858+0.001*X)
7,270
0,850
Y(X)=0*exp(0/X))
  Нет
0,000
Y(X)= +84.364+0.0000*X**2
8,102
0,006
Àáñîëþòíàÿ îøèáêà
Y(X)=  352.893+7.152*X**1
5,523
0,914
4,000
0.027*X**2
3,000
Выбрана функция Y(X)= 352.893+7.152*X  0.027*X*X
2,000
Таблица остатков
1,000
Номер
Факт
Расчет
0,000
 1. 1. 93
125,800
125,224
-1,000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
 1. 2. 93
124,700
124,933
-2,000
 1. 3. 93
120,100
122,230
-3,000
 1. 4. 93
123,200
122,777
-4,000
 1. 5. 93
118,500
119,509
-5,000
 1. 6. 93
119,900
117,827
-6,000
 1. 7. 93
122,000
124,707
-7,000
 1. 8. 93
126,000
124,096
 1. 9. 93
123,000
120,976
 1. 10. 93
120,000
119,509
 1. 11. 93
116,000
116,906
 1. 12. 93
113,000
111,499
 1. 1. 94
117,900
119,509
 1. 2. 94
110,700
116,906
 1. 3. 94
107,400
110,257
46


¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
ным 0.2, а число итераций   5. Структура отчета за
Îòíîñèòåëüíàÿ îøèáêà %
висит от сделанного выбора пунктов: в отчет попадут
таблицы, рядом с которыми стоит символ “крестик”.
4,000
В блоке "Структура отчета" оставьте заказ всех таб
3,000
лиц отчета. Для начала вычислений нажмите кнопку
2,000
"Вычислить".
1,000
После этого появится заставка, внутри которой
0,000
содержится сообщение о выполнении программой
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
-1,000
соответствующих этапов. Результаты обработки ото
-2,000
бражаются в Протоколе "Факторный  анализ", кото
-3,000
рый может включать 5 таблиц. Суть всех коэффици
-4,000
ентов, представленных в таблицах, и формулы расче
-5,000
та  описаны во втором разделе данного документа.   
-6,000
A
B
C
Протокол факторного анализа
Факторный и компонентный  анализ
Оценки собственных значений
Компонентный анализ является методом оп
Фактор
Собств.
Накопленное
значение
отношение
ределения структурной зависимости между случай
ными переменными. В результате его использования
1
6.759
0.875
получается сжатое описание малого объема, несу
2
0.962
1.000
щее почти всю информацию, содержащуюся в ис
ходных данных. Факторный анализ является более
3
0.070
1.009
общим методом преобразования исходных перемен
4
0.007
1.010
ных по сравнению с компонентным анализом.
5
0.000
1.010
Проведем факторный и компонентный анализ
6
0.011
1.008
всех показателей, содержащихся во второй таблице.
Для этого активизируйте вторую таблицу демонстра
7
0.028
1.005
ционного файла Demo.xls и выделите весь блок дан
8
0.036
1.000
ных, который кроме числовых значений будет содер
Отобрано факторов 2, количество итераций = 5
жать наименования таблицы, наблюдений  и пере
Матрица факторных нагрузок
менных. Установите курсор на пункт меню “СтатЭкс”,
Переменная
1_
2_
нажмите “мышку” и в появившемся меню выберите
пункт “Факторный анализ”.
  Индекс потребительских цен
0.700
0.700
В диалоговом окне “Установка блока данных” в
  Индекс оптовых цен
0.795
0.525
блоке “Ориентация таблицы” установите параметр
  Объем промышленного произ
0.976
0.177
“По строкам”,  а указатель наличия наименования
водства.
переменных таблицы, наблюдений оставьте без из
  М0, млрд. руб.
0.985
0.075
менения, далее воспользуйтесь кнопкой
  M2, млрд. руб.
0.981
0.030
“Установить”, после   чего  появится   диалоговое
  Средневзвешенный обменный
0.986
0.128
окно "Факторный и компонентный анализ".
курс, руб./$
  Импорт (C.I.F.), млрд. руб.

0.933
0.262
  Экспорт (F.O.B.), млрд. руб.
0.954
0.272
Матрица повернутых факторных нагрузок
Переменная
1_
2_
  Индекс потребительских цен
0.000
0.958
  Индекс оптовых цен
0.419
0.856
  Объем промышленного произ
0.931
0.343
водства,.
  М0, млрд. руб.

0.887
0.435
  M2, млрд. руб.
0.860
0.472
  Средневзвешенный обменный
0.914
0.390
курс, руб./$
  Импорт (C.I.F.), млрд. руб.

0.937
0.000
Выберите все доступные переменные. Для
этого в группе "Добавить" воспользуйтесь кнопкой
  Экспорт (F.O.B.), млрд. руб.
0.960
0.000
"Все", после чего наименования всех переменных из
Оценки общностей
левого списка доступных переменных переместятся
Переменная
Общность Специфич
в правый список выбранных переменных. В поле "Тип
ность
данных" оставьте установку "Исходные наблюдения",
Индекс потребительских цен
0.979
0.093
а в поле "Варимаксное вращение" оставьте символ
Индекс оптовых цен
0.907
0.047
выбора (крестик). Установите уровень отбора рав
47



¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
Переменная
Общность Специфич
Выделите весь блок данных (A1: i29), который
ность
кроме числовых значений будет содержать наимено
Объем промышленного произ
0.985
0.017
вания таблицы, наблюдений  и переменных. Устано
водства, .
вите курсор на пункт меню “СтатЭкс”, нажмите
  М0, млрд. руб.
0.975
0.007
“мышку” и в появившемся меню выберите пункт
  M2, млрд. руб.
0.962
0.004
“Кластерный анализ”.
В диалоговом окне “Установка блока данных” в
  Средневзвешенный обменный
0.988
0.012
курс, руб./$
блоке “Ориентация таблицы” установите параметр
  Импорт (C.I.F.), млрд. руб.
0.939
0.029
“По колонкам”,  а указатель наличия наименования
таблицы, переменных и наблюдений оставьте поме
  Экспорт (F.O.B.), млрд. руб.
0.984
0.031
ченными символом выбора (крестик). Далее вос
Значения факторов
пользуйтесь кнопкой “Установить”, после   чего  поя
Наблюдение
1_
2_
вится   диалоговое  окно "Кластерный анализ".
 1.1.93
0.775
1.564
 1.2.93
0.756
1.369
 1.3.93
0.986
0.485
 1.4.93
0.731
0.895
 1.5.93
0.840
0.181
 1.6.93
0.599
0.282
 1.7.93
0.382
1.192
 1.8.93
0.198
1.463
 1.9.93
0.274
0.844
 1.10.93
0.345
0.427
 1.11.93
0.396
0.083
 1.12.93
0.391
0.594
 1.1.94
0.290
0.216
 1.2.94
0.391
0.586
 1.3.94
0.339
1.175
 Выберите все доступные переменные. Для
 1.4.94
0.223
1.070
этого в группе "Добавить" воспользуйтесь кнопкой
 1.5.94
0.160
1.290
"Все", после чего наименования всех переменных из
 1.6.94
0.053
1.417
левого списка доступных переменных переместятся
 1.7.94
0.001
1.513
в правый список выбранных переменных. Выберите
 1.8.94
0.019
1.750
тип метрики “Евклидова”, а в поле "Четкость класси
 1.9.94
0.666
1.160
фикации" при помощи спинера установите значение
 1.10.94
1.827
0.213
3. В блоке "Структура отчета" оставьте заказ  табли
 1.11.94
2.279
0.466
цы "Результаты классификации" и построение гра
 1.12.94
3.234
1.040
фика кластеризации.
Кластерный анализ
Для начала вычислений нажмите кнопку
Кластерный анализ предназначен для разбие
"Вычислить". После этого появится заставка, внутри
ния наблюдений на однородные группы (кластеры).
которой содержится сообщение о выполнении про
Проиллюстрируем  возможности его проведения на
граммой соответствующих этапов.
примере обработки данных о крупнейших банках РФ.
Результаты обработки отображаются в Прото
Предположим, что нас интересует классификация
коле "Кластерный  анализ", который  включает одну
банков, выполненная по всем 8 имеющимся показа
таблицу и один график.  В таблице отражены наиме
телям.  Для этого активизируйте третью таблицу де
нование объектов классификации, номер группы, в
монстрационного файла Demo.xls.
которую они отнесены, расстояние объединения и
координаты центра группы. Из приведенных резуль
татов следует, что 27 банков разделены на 8 групп,
причем банки Менатеп, Внешторгбанк и Сбербанк
РФ по совокупности исследуемых показателей стоят
особняком от остальных и каждый из них выделен в
самостоятельную группу. В 5 остальных групп входят
от 3 до 7 банков.
Для графической интерпретации результатов
кластерного анализа приводится график расположе
ния исходных объектов в пространстве первых двух
главных компонент. При этом объекты, попавшие в
один кластер, отображаются одним цветом.
Примечание. Иногда объекты из разных кла
стеров расположены столь близко, что может соз
даться иллюзия о неправильной классификации. Это
связано с тем,  что классификация проводится по
большому числу переменных, а график строится по
48


¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
двум координатам (хотя и отражающим основные
Частотный анализ
особенности данных), поэтому некоторые расхожде
Вместе с долговременными изменениями, во
ния между результатом классификации и графиче
временных рядах часто появляются более или менее
ским отображением неизбежны.
регулярные колебания. Эти  изменения наблюдае
A
B
C
D
E
мых значений могут быть строго периодическими или
Протокол кластерного анализа
близкими к  таковым и оцениваться в частотном ас
Результат кластеризации
пекте.
Кла
Расстояние
Коор
Коор
Для иллюстрации возможностей частотного
стер
объединения
дината
дината
X
Y
анализа продолжим исследование показателя
Банк "C Петербург"
1
403105.594
0.606
0.504
“Индекс потребительских цен”, приведенного во вто
рой таблице демонстрационного примера. Для этого
Енисей
1
403105.594
0.607
0.541
активизируйте вторую таблицу файла Demo.xls и, не
Якиманка
1
403105.594
0.699
0.462
выделяя блок, активизируйте пункт "СтатЭкс", а в
Башкредитбанк
2
658934.875
0.442
0.559
нем   "Частотный анализ". Таким образом, информа
Возрождение
2
658934.875
0.461
0.433
ционный блок, определенный "по умолчанию" кроме
числовых данных будет содержать наименования
Мосстройэкономба
2
658934.875
0.533
0.566
нк
таблицы, переменных и наблюдений. Поэтому, в поя
Промышл.
2
658934.875
0.468
0.577
вившемся диалоговом окне “Установка блока дан
строителный
ных” в блоке “Ориентация таблицы” установите па
Моск. индустриа
2
658934.875
0.300
0.726
раметр “По строкам”, а указатель наименований таб
лый
Альфа банк

3
930044.938
0.496
0.208
лицы, наблюдений, и переменных оставьте без из
менения, после чего воспользуйтесь кнопкой
Межкомбанк
3
930044.938
0.454
0.223
“Установить”.
Столичный банк
3
930044.938
0.353
0.018
 Для получения корректных результатов час
сбереж.
тотного анализа необходимо иметь достаточно
Автобанк
3
930044.938
0.289
0.074
большой объем данных (не менее 50 наблюдений), из
Роскредит
3
930044.938
0.152
0.181
которых предварительно исключена тенденция. Про
Токобанк
3
930044.938
0.316
0.051
грамма автоматически контролирует выполнение
Мостбанк
3
930044.938
0.374
0.106
этих требований и в случае их нарушения выдает со
ответствующее сообщение, но не запрещает даль
Мосбизнесбанк
4
1750768.500
0.092
0.131
нейший анализ. В нашем примере объем данных
Промстройбанк
4
1750768.500
0.268
0.402
меньше установленного критического уровня. Одна
Уникомбанк
4
1750768.500
0.284
0.702
ко, на запрос о необходимости продолжения вычис
Тверьуниверсалбанк
4
1750768.500
0.375
0.035
лений ответьте утвердительно.
После этого появится диалоговое окно частот
Империал
4
1750768.500
0.044
0.563
ного анализа.
Межд. Моск. банк
4
1750768.500
0.119
0.416
Менатеп
5
3204395.750
0.023
0.079
ОНЭКСИМбанк
6
5386877.500
0.794
1.751
Инкомбанк
6
5386877.500
0.373
0.305
МФК
6
5386877.500
0.385
2.062
Внешторгбанк
7
13160116.000
1.656
3.233
Сбербанк РФ
8
61038228.000
4.458
2.321
Ãðàôèê êëàñòåðèçàöèè
4 . 0 0 0
3 . 0 0 0
Для выявления наличия и устойчивости периода ко
лебаний обычно используется следующий аппарат
2 . 0 0 0
частотного анализа:
1 . 0 0 0
• Гармонический анализ
• Спектральный анализ
0 . 0 0 0
• Частотная фильтрация
- 1 . 0 0 0
• Кросс спектральный анализ.
В "Списке переменных" диалогового окна
- 2 . 0 0 0
отображаются наименования показателей, взятых из
- 3 . 0 0 0
- 1 . 0 0 0
0 . 0 0 0
1 . 0 0 0
2 . 0 0 0
3 . 0 0 0
4 . 0 0 0
5 . 0 0 0
базы данных в соответствии с указанным раннее
шаблоном. Текущей является переменная, которая
выделена светящейся строкой курсора.
При перемещении курсора (движения “мыш
ки”) по списку переменных, справа отображается
49


¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
график их значений, который можно увеличить до
i
Мощ
a(i)
b(i)
Час
Период F зна
Вывод
размера полного окна. Для этого достаточно нажать
ность
тота
чение
левую кнопку “мышки”, когда ее указатель установ
12
0.003
0.054
0.000
2.000
2.000
0.000
Не зна
лен на графике. При желании график можно распеча
чима
тать или перенести в другие программы (например, в
 Из приведенных результатов следует, что значимой
текстовый редактор) стандартными средствами
является лишь первая гармоника.
Excel. Возврат в диалоговое окно происходит при
Частотная фильтрация
повторном нажатии  левой кнопки "мышки" или кла
виши Esc.
Для проведения спектрального анализа необ
В блоке "Вид анализа" выберите один из че
ходимо выполнить все действия, описанные в 1.7.8, а
тырех пунктов. Отметим, что кросс спектральный
в блоке "Вид анализа" диалогового окна "Частотный
анализ можно проводить лишь при наличии не менее
анализ" следует выбрать пункт "Частотная фильтра
двух показателей. При не выполнении этого условия
ция". После этого появится диалоговое окно
данный пункт заблокирован.
"Частотная фильтрация", позволяющее выбрать тип
Для начала расчетов следует нажать на кнопку
фильтра, определить структуру отчета и заказать
Вычислить”, а для отказа от  вычислений   нажать
графическое отображение результатов.
кнопку "Выход”.
В программе реализован высокочастотный
Для всех видов анализа (кроме частотной
фильтр и низкочастотный фильтр. Для каждого
фильтрации) программа автоматически диагности
фильтра рассчитывается соответствующая силовая и
рует наличие тенденции в исследуемом показателе и
фазовая характеристики. В зависимости от цели
при обнаружении ее выдает соответствующее сооб
фильтрации выберите тип фильтра. Низкочастот
щение. В этом случае целесообразно выйти из ре
ный фильтр (установленный по умолчанию) предна
жима частотного анализа и воспользоваться пунктом
значен для устранения тренда (низкочастотной со
меню СтатЭксперта "Временные ряды". В указанном
ставляющей временного ряда наблюдений). Высо
пункте следует выбрать класс моделей "Кривые
кочастотный фильтр, наоборот, предназначен
роста", а затем в таблице остатков полученного от
для выделения тренда из исходных данных.
чета выделить числовые значения в столбце
 Установите желаемую величину частоты от
"Абсолютная ошибка" и вновь вызвать режим частот
сечки (по умолчанию она равна 0.1). Значение этого
ного анализа.
показателя можно изменять в пределах от 0 до 0.5.
Структура отчета зависит от сделанного вы
Гармонический анализ
бора пунктов: в отчет попадут таблицы, рядом с кото
Для проведения гармонического анализа не
рыми стоит символ крестик.
обходимо выполнить все действия, описанные в
1.7.8, а в блоке "Вид анализа" диалогового окна
"Частотный анализ" следует выбрать пункт
"Гармонический анализ". Вычисления начнутся сразу
после нажатия кнопки "Вычислить".
После проведения вычислений по показателю
"Индекс потребительских цен" появится следующий
протокол.
A
B
C
D
E
F
G
H
Гармонический анализ переменной   Индекс потреби
тельских цен

i
Мощ
a(i)
b(i)
Час
Период F зна
Вывод
Оставьте все установки "по умолчанию"
ность
тота
чение
(низкочастотный фильтр, частота отсечки=0.1, пол
1
77.252
0.733
8.759
0.167 24.000 42.986  Значима
ный объем отчета и построение графиков) и для на
чала расчетов  нажмите на кнопку “Вычислить”.
2
4.842
2.142
0.502
0.333 12.000
0.557
Не зна
Протокол частотной фильтрации в зависимо
чима
3
4.229
1.803
0.990
0.500
8.000
0.483
Не зна
сти от установок, сделанных в соответствующем диа
чима
логе, может и содержать две таблицы   "Выход
4
1.094
0.529
0.902
0.667
6.000
0.121
Не зна
фильтра" и "Передаточная функция". Содержа
чима
щиеся в этих таблицах показатели отражены на гра
5
1.662
0.938
0.885
0.833
4.800
0.185
Не зна
чима
фиках.
6
1.906
0.358
1.333
1.000
4.000
0.212
Не зна
Фильтр считается хорошим, если фазовая ха
чима
рактеристика близка к нулю на тех частотах, на кото
7
0.336
0.495
0.302
1.167
3.429
0.037
Не зна
рых усиление близко к единице, а частотная полоса,
чима
8
3.597
1.521
1.133
1.333
3.000
0.408
Не зна
на которой усиление изменяется от нуля до единицы,
чима
достаточно узкая.
9
0.095
0.036
0.307
1.500
2.667
0.010
Не зна
A
B
чима
Низкочастотная фильтрация переменной
10
0.600
0.759
0.156
1.667
2.400
0.066
Не зна
чима
Индекс потребительских цен
11
0.503
0.433
0.562
1.833
2.182
0.055
Не зна
Выход фильтра
чима
Наблюдение
Значение
50


¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Наблюдение
Значение
Âûõîä ôèëüòðà
 1.3.93
2.802
 1.4.93
1.790
1 2 . 0 0
 1.5.93
1.653
1 0 . 0 0
 1.6.93
1.156
 1.7.93
3.424
8 . 0 0
 1.8.93
6.125
6 . 0 0
 1.9.93
1.761
4 . 0 0
 1.10.93
1.179
2 . 0 0 0
 1.11.93
3.771
0 . 0 0
 1.12.93
4.329
1
2
3
4
5
6
7
8
9
1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2
-
 1.1.94
1.985
 1.2.94
3.812
-
 1.3.94
4.101
-
 1.4.94
0.195
 1.5.94
0.645
Óñèëåíèå
 1.6.94
0.789
Ïåðåäàò î÷ íàÿ ôóíêöèÿ
 1.7.94
0.836
 1.8.94
1.010
1 , 0 0 0
5 , 0 0 0
Ôàçîâûé
0 , 0 0 0
- 5
0 , ,0
0 0
0 0
0
 1.9.94
4.404
 1.10.94
9.909
Спектральный анализ
 1.11.94
5.599
Для проведения спектрального анализа необ
 1.12.94
4.786
ходимо выполнить все действия, описанные в 1.7.8, а
Частота отсечки = +0.1000
Передаточная функция
в блоке "Вид анализа" диалогового окна "Частотный
анализ" следует выбрать пункт "Спектральный ана
Номер
Частота
лиз". После этого появится диалоговое окно
1
0.000
"Спектральный анализ", позволяющее выбрать один
2
0.033
3
0.067
из трех типов окна и заказать графическое отобра
4
0.100
жение результатов.
5
0.133
6
0.167
7
0.200
8
0.233
9
0.267
10
0.300
11
0.333
12
0.367
13
0.400
14
0.433
15
0.467
16
0.500
17
0.533
В блоке "Тип окна" выберите пункт "Окно Пар
18
0.567
зена" и закажите построение графиков.
19
0.600
Для начала расчетов следует нажать на кнопку
20
0.633
Вычислить”, а для отказа от  вычислений   нажать
21
0.667
кнопку "Выход”.
22
0.700
Протокол  содержит одну таблицу, в которой
23
0.733
для каждой частоты выдается соответствующее ей
24
0.767
значение спектрограммы и спектральной плотности.
25
0.800
В нижней строке таблицы представлено наименова
26
0.833
ние типа использованного в расчетах окна.
27
0.867
Содержащиеся в  таблице показатели отобра
28
0.900
жаются на графике.
29
0.933
30
0.967
51


¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
Кросс спектральный анализ  
Ïåðåäàò î÷ íàÿ ôóíêöèÿ
Óñèëåíèå
Для проведения кросс спектрального анализа
(т.е. анализа взаимного спектра) необходимо выпол
1 , 0 0 0
2 , 0 0 0
Ôàçîâûé
нить все действия, описанные в 1.7.8, а в блоке "Вид
0 , 8 0 0
анализа" диалогового окна "Частотный анализ" сле
1 , 0 0 0
ñäâèã
дует выбрать пункт " Кросс спектральный анализ ".
0 , 6 0 0
0 , 0 0 0
После этого появится одноименное диалоговое окно.
0 , 4 0 0
0 , 2 0 0
- 1 , 0 0 0
0 , 0 0 0
- 2 , 0 0 0
0 7 3 0 7 3
0,00 0,16 0,33 0,50 0,66 0,83
A
B
C
D
Спектральный анализ переменной   Индекс
потребительских цен

Характеристики спектра мощности
Номер
Час
Спектрогра Спектральная
тота
мма
плотность
1
0.000
1085.200
179615.531
Кросс спектральный анализ проводится по
2
0.033
1032.260
162821.531
двум переменным, первая из которых выбрана на
3
0.067
882.427
119741.742
предыдущем шаге в диалоге Частотного анализа. Ее
4
0.100
660.885
68112.641
наименование отображается в блоке "Первая вы
5
0.133
404.045
26325.404
бранная переменная".
6
0.167
152.445
4287.958
В "Списке переменных" диалогового окна
7
0.200
57.104
334.900
отображаются наименования показателей, взятых из
8
0.233
197.845
5186.542
базы данных в соответствии с указанным ранее шаб
9
0.267
258.198
9317.914
лоном. Текущей является переменная, которая выде
10
0.300
242.416
8476.536
лена светящейся строкой курсора. Выберите в каче
11
0.333
168.751
4273.881
стве второй переменной "Индекс оптовых цен".
12
0.367
65.008
719.639
При перемещении курсора (движения
13
0.400
43.723
186.333
“мышки”) по списку переменных, справа отобража
14
0.433
122.648
1892.096
ется график их значений, который можно увеличить
15
0.467
160.678
3384.813
до размера полного окна. Для этого достаточно на
16
0.500
151.994
3070.988
жать “мышку”, когда ее указатель установлен на гра
17
0.533
103.632
1428.615
фике. При желании график можно распечатать или
18
0.567
32.107
134.919
19
0.600
43.174
277.147
перенести в другие программы (например, в тексто
20
0.633
100.281
1414.302
вый редактор) стандартными средствами Excel. Воз
21
0.667
126.344
2213.405
врат в диалоговое окно происходит при повторном
22
0.700
116.204
1846.586
нажатии  мышки или клавиши Esc.
23
0.733
74.586
738.869
В блоке "Тип окна" выберите пункт "Окно
24
0.767
14.600
27.059
Тьюки".
25
0.800
47.916
374.027
Для начала расчетов следует нажать на кнопку
26
0.833
94.296
1340.624
Вычислить”, а для отказа от  вычислений   нажать
27
0.867
112.978
1888.386
кнопку “Выход”. Последней возможностью целесо
28
0.900
99.385
1451.974
образно воспользоваться в случае, если на графике
29
0.933
57.797
493.540
или в списке переменных  Вы заметили несоответст
30
0.967
1.800
6.675
вие со своими исходными данными.
Тип окна   Парзена
Протокол содержит одну таблицу, в которой
для каждой частоты выдается соответствующее ей
значение когерентности, фазового сдвига и коэффи
циента усиления. В нижней строке таблицы пред
ставлено наименование использованного в расчетах
окна. Содержащиеся в  таблице показатели отраже
ны на графике.
A
B
C
D
E
Кросс спектральный анализ переменных
Индекс потребительских цен и Индекс оптовых
цен

Характеристики кросс спектра
Номер
Час
Когерен
Фазовый
Усиление
тота
тность
сдвиг
52




¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Номер
Час
Когерен
Фазовый
Усиление
тота
тность
сдвиг
1
0.000
17813.813
0.000
85252.445
2
0.125
2607.673
0.007
2135.664
3
0.250
387.910
0.022
110.815
4
0.375
160.673
0.037
33.410
5
0.500
93.293
0.205
13.950
6
0.625
143.087
0.155
25.818
7
0.750
166.281
0.154
28.913
8
0.875
17.463
1.117
1.047
9
1.000
52.800
0.000
2.207
Тип окна  Тьюки
Õ àðàêòåðèñ ò èêè êðîñ ñ -ñ ïåêò ðà
Для продолжения работы необходимо выбрать
конкретный способ восстановления данных
1 8 0 0 0 . 0 0 0
0 . 2 0 0
1 6 0 0 0 . 0 0 0
(последний способ доступен не всегда!) и нажать
0 . 0 0 0
1 4 0 0 0 . 0 0 0
кнопку "Вычислить". Нажатие кнопки "Отмена" при
- 0 . 2 0 0
1 2 0 0 0 . 0 0 0
ведет к прекращению обработки данных.
Êîãåðåí-
1 0 0 0 0 . 0 0 0
- 0 . 4 0 0
òíîñòü
В соответствии с первым способом пропущен
8 0 0 0 . 0 0 0
Ôàçîâûé
- 0 . 6 0 0
ñäâèã
ные наблюдения восстанавливаются путем исполь
6 0 0 0 . 0 0 0
- 0 . 8 0 0
4 0 0 0 . 0 0 0
зования стандартных интерполяционных формул, в
- 1 . 0 0 0
2 0 0 0 . 0 0 0
которых число точек интерполяционного полинома
0 . 0 0 0
- 1 . 2 0 0
принимается равным 3. Восстановленное значение
0.000
0.125
0.250
0.375
0.500
0.625
0.750
0.875
1.000
примерно равно 78.30.
Восстановление наблюдений при помощи ап
Восстановление пропущенных наблюдений
проксимации сводится к подбору кривой роста,
Выделенные пользователем данные могут со
наилучшим образом отображающей особенности
держать нечисловые и пропущенные наблюдения
изменения исследуемого показателя. При этом про
(клетки, не содержащие никакой информации). При
пущенные наблюдения заменяются на расчетные
обнаружении нечислового значения программа вы
значения аппроксимирующей модели. Набор ап
дает соответствующее сообщение и прекращает ра
проксимирующих моделей определяется пользова
боту.
телем (см. режим "Обработка временных рядов. Про
Пропущенные наблюдения должны быть пред
гнозирование"). Если выбрать все доступные моде
варительно устранены: либо удалены из информаци
ли, то программа, построив эти модели, автоматиче
онного блока при помощи операций "Удалить стро
ски выберет лучшую из них и выдаст восстановлен
ку", "Удалить столбец", либо  заменены числовыми
ное значение примерно равно 78.79.
значениями "вручную" или при помощи математиче
Восстановление наблюдений при помощи
ских методов программным путем.
регрессионных зависимостей заключается в по
Предположим, что по каким   либо причинам
строении модели взаимосвязи показателя, который
нам не удалось получить сведения о цене на вторич
содержит пропущенные наблюдения, с одним или
ных торгах по ГКО 22014 за 11.09.95. Следовательно,
несколькими показателями, не содержащими про
в таблице 1 книги Demo.xls в клетке H9 вместо числа
пущенные наблюдения. Этот способ не доступен при
78.10 должен стоять пробел. Для воссоздания этой
обработке одномерных данных. Поэтому для его ил
ситуации сотрите указанное число (установите кур
люстрации воспользуйтесь режимом корреляцион
сор на клетку H9, активизируйте пункт "Правка", да
ного анализа, техника реализации которого описана
лее   "Очистить"   "Все"). Тогда в режиме "Обработка
в разделе 1.7.5.  После выбора данных (вся таблица 1
временных рядов" (см. раздел 1.7.2) после выбора
книги Demo.xls), активизации режима
ГКО 22014 и нажатия кнопки "Вычислить" появится
"Корреляционный анализ", выбора в диалоговом ок
сообщение:
не  "Корреляционный анализ" всех переменных и на
жатия кнопки "Вычислить" появится следующее диа
логовое окно:
Если на этот запрос ответить отрицательно,
программа приостанавливает свою работу и возвра
тит пользователя в таблицу Data. В случае положи
тельного ответа появляется диалоговое окно
"Востановление пропущенных наблюдений" с пред
ложением выбрать способ восстановления.
Метод построения модели (парная регрессия,
линейная, множественная) и круг показателей опре
деляется пользователем таким же образом, как и в
53

¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
режиме построения регрессионных моделей (см.
В первой части подробно описана установка про
раздел 1.7.5). Предположим, что у нас есть основа
граммы на компьютер, основные понятия системы и техни
ния считать существенной зависимость между вы
ка решения задач анализа данных на примерах, являющих
ся элементами поставляемой системы. Вы можете воспро
пусками 22014  и, например, 21041, но форма этой
извести расчеты, описанные в документации, на своем
зависимости не известна. Выберите режим "Парная
компьютере и убедиться в работоспособности своего эк
регрессия", а в нем закажите все доступные модели.
земпляра программы. При изучении примеров целесооб
Программа, построив эти модели, автоматически
разно также активно пользоваться встроенными в про
выберет лучшую из них и выдаст восстановленное
грамму средствами помощи, что позволит Вам максималь
значение примерно равное 78.50.
но быстро изучить и правильно использовать все вычисли
 Все описанные  способы дают хорошие ре
тельные возможности программы.
зультаты при обработке временных рядов наблюде
Во второй части приведено описание математиче
ских методов, реализованных в программе. К ней имеет
ний. При обработке пространственных данных, таких,
смысл обратиться в том случае, если Вас заинтересовала
например, как данные о крупнейших банках РФ, при
теоретическая основа реализованных в программе мето
веденных в третьем листе демонстрационного фай
дов.
ла, целесообразнее использовать последний способ
Список литературы
восстановления пропущенных наблюдений.
Примечание.1 Восстановление пропущенных
1. Андерсон Т. Статистический анализ временных
рядов.   М.:Мир, 1976.
наблюдений при всех описанных выше способах
2. Бокс Дж., Дженкинс Г.  Анализ временных рядов,
осуществляется лишь в том случае, если по каждому
прогноз и управление.    М.:Мир, 1974.
показателю  количество пропущенных наблюдений
3. Богачев В.В. Моделирование нестационарных
не превышает половины всего объема наблюдений, и
процессов авторегрессиоными моделями. В сб.: Модели
выделенный блок данных содержит наименования
рование экономических процессов М.:МЭСИ, 1989.
наблюдений и переменных.
4. Богачев В.В. Альтернативные представления
Примечание 2.  Клетки рабочей таблицы
адаптивных моделей прогнозирования. В сб.: Модели и
“Data”, содержащие пропущенные значения, выде
методы экономической кибернетики М.:МЭСИ, 1988.
5. Богачев В.В. Моделирование нестационарных
ляются красным цветом. Результаты восстановления
временных рядов с помощью несимметричного фильтра. 
пропущенных значений заносятся только в рабочую
Материалы семинара по планированию эксперимента
таблицу.
М.:МДНТП, 1985.
От авторов
6. Богачев В.В. Метод прогнозирования одномерно
го временного ряда. В сб.: Применение методов вычисли
ОЛИМП:СтатЭксперт (Windows 3.11, Windows 95) 
тельной математики в экономических исследованиях
это очередной шаг в развитии пакетов статистической об
М.:МЭСИ, 1985.
работки серии ОЛИМП. Пакет позволяет организовать пол
7. Горчаков А.А., Орлова И.В. Компьютерные эконо
ный цикл исследований по статистическому анализу  и про
мико математические модели.    М.: ЮНИТИ, 1995.
гнозированию данных, начиная с их ввода, проверки, ви
8. Горчаков А.А., Половников В.А. Тенденции разви
зуализации и заканчивая проведением расчетов и анали
тия кредитного рынка России.    Ж. “Банковское дело” N 3,
зом результатов на основе широкого набора современных
1995.
методов прикладной статистики, многие из которых реали
9. Горчаков А.А., Половников В.А. Обзор процентных
зованы по оригинальным алгоритмам.
ставок рынка ссудного капитала.  Ж. “Банковское дело” N 5,
Программа “ОЛИМП:СтатЭксперт” разработана со
1995.
трудниками Департамента информационных технологий
10. Горчаков А.А., Половников В.А. Проблемные во
ТОО “Росэкспертиза”. Мы надеемся, что она существенно
просы прогнозирования финансово экономических показа
облегчит Вам решение задач анализа и прогнозирования
телей.   Бюллетень Информационного центра “Рейтинг” N
финансово   экономических показателей, т.к. в ней реали
3,1995.
зованы наиболее эффективные вычислительные методы,
11. Горчаков А.А., Половников В.А. Финансовая ма
хорошо зарекомендовавшие себя в практической работе, и
тематика.  М.:ВЗФЭИ, 1995.
оригинальные авторские алгоритмы решения указанных
12. Горчаков А.А. и др. Методы экономико
задач.
математического моделирования и прогнозирования в но
 В отличие от своих прототипов “ОЛИМП” и
вых условиях хозяйствования.   М.: ВЗФЭИ, 1991.
“ОРАКУЛ 2”, успешно функционирующих в среде MS DOS в
13. Горчаков А.А., Половников В.А. Одномерные ме
течение многих лет, данная программа использует интер
тоды и модели экономического прогнозирования.   Таш
фейс Microsoft Excel. Использование этой популярной элек
кент: Мехмат, 1990.
тронной таблицы в качестве оболочки вычислительных мо
14. Горчаков А.А., Синилов Д.А. Обработка времен
дулей, с одной стороны, полностью решает вопросы орга
ных рядов наблюдений с использованием ПЭВМ.
низации и ведения информационной базы, связи с другими
М.:МЭСИ, 1988.
прикладными программами и приложениями Windows, а с
15. Горчаков А.А. Использование статистических ме
другой стороны, создает максимально удобную и привыч
тодов исследования временных рядов для оценки результа
ную среду для многих пользователей. Для работы с про
тивности новых условий хозяйствования. В кн.: Математи
граммой достаточно иметь минимальный опыт работы с
ко статистический анализ в экономике и производстве. 
Windows и Excel. Для обеспечения высокого быстродейст
М.:МЭСИ, 1988.
вия все вычислительные модули реализованы на языке
16. Горчаков А.А. Методические указания по работе
Си++ в виде библиотек динамической загрузки. Такая кон
на ПЭВМ с программой моделирования и прогнозирования
фигурация программы принципиально отличает
социально  экономических процессов “ОРАКУЛ”.  М.: Аг
“ОЛИМП:СтатЭксперт” от аналогичных программ.
роНИИТЭИПП, 1988.
Документация по программе “ОЛИМП:СтатЭксперт”
17. Горчаков А.А., Половников В.А. Прогнозирование
состоит из двух частей.
экономических процессов с сильной сезонностью. В кн.:
54

¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
Моделирование экономических процессов.    М.: МЭСИ,
• Оборачиваемости чистых активов
1987.
• Рентабельности чистых активов (RONA)
18. Горчаков А.А. Использование адаптивных мето
• Рентабельности собственного капитала (ROE)
дов в АСУ. В кн.: Организационно методические аспекты
• Коэффициента экономического роста компа
автоматизированной обработки информации.   М.: МЭСИ,
1986.
нии (SG)
19. Горчаков А.А. и др. Оценивание точности и адек
• Средневзвешенной стоимости капитала
ватности моделей экономического прогнозирования. В кн.:
(WACC).
Математические методы моделирования экономических
“Изюминкой” модели является расщепление
процессов.  М.: МЭСИ, 1986.
этих комплексных показателей на факторы, их со
20. Горчаков А.А. Прогнозирование сезонных про
ставляющие. Это позволяет определить первопричи
цессов на основе метода Тейла Вейджа. В кн.: Проблемные
ны и взаимосвязь изменения комплексных показате
вопросы конструирования АСУ.   М.:МЭСИ, 1985.
лей эффективности деятельности предприятия. Схе
21. Горчаков А.А. Использование адаптивных моде
лей для краткосрочного экономического прогнозирования.
мы факторного анализа ключевых показателей по
В сб.: Актуальные вопросы экономико статистических ис
зволяют наглядно проследить влияние первичных
следований.   М.: ЦСУ СССР, Городская конференция мо
факторов на формирование комплексных показате
лодых ученых,1982.
лей, причины их изменения.
22. Горчаков А.А., Половников В.А. Использование
Анализ динамики финансового состояния
метода адаптивной фильтрации в прогнозировании быто
предприятия может проводиться в сопоставимых
вых услуг. В сб.: Применение методов вычислительной ма
ценах с учетом индексов инфляции.
тематики в экономике.   М.: МЭСИ, 1981.
Эта система анализа полностью реализована в
23. Горчаков А.А. Прогнозирование сезонных коле
баний. В сб.: Вопросы эффективности и качества в систе
компьютерной программе финансового анализа
мах управления народным хозяйством.  М.: МЭСИ, 1980.
Олимп: ФинЭксперт , созданной специалистами Де
24. Лукашин Ю.П. Адаптивные методы краткосрочно
партамента информационных технологий Росэкспер
го прогнозирования.    М.:Статистика, 1979.
тизы.
25. Половников В.А.., Горчаков А.А. Модели и методы
Схема проведения анализа по модели Дюпон,
экономического прогнозирования.    М.: МЭСИ, 1980.
рассматриваемой в этой статье , такова.
26. Харман Г.Г. Современный факторный анализ. 
Сначала формируется финансовая отчетность
М.: Статистика, 1972.
в форме GAAP.
27. Четыркин Е.М. Статистические методы прогнози
рования.   М.: Статистика, 1977.
Затем последовательно анализируются клю
чевые показатели модели Дюпон и факторы, их  со
МНОГОФАКТОРНАЯ МОДЕЛЬ
ставляющие.
Динамика этих показателей исследуется, ис
ДЮПОНА АНАЛИЗА
пользуя возможность их факторного расщепления.
ЭФФЕКТИВНОСТИ
Это позволяет сделать содержательные выводы о
причинах их изменения. И наконец, построение на
ДЕЯТЕЛЬНОСТИ
глядных схем факторного анализа позволяет просле
ПРЕДПРИЯТИЯ.
дить первопричины изменения финального показа
теля.
Аудиторская и консалтинговая фирма
«Росэкспертиза»
1. Формирование финансовой
Современная деятельность любой компании
отчетности в форме GAAP
направлена  на  получение прибыли в условиях ост
Основные международные принципы
роконкурентной рыночной среды.
Для эффективного управления такой компани
формирования финансовой отчетности.
ей необходимо внедрение и ведение на предприятии
Общие принципы и терминология
эффективной системы управленческого учета и фи
Структура отчета о прибылях и убытках
нансового менеджмента.
(Income Statement or Profit and Losses Statement)
В этих условиях финансовый анализ и управ
Данный документ отражает все доходы и
ление рентабельностью и деловой активностью
расходы, понесенные компанией за отчетный пери
предприятия приобретает решающее значение.
од. Структурно это может быть представлено в сле
Система или модель анализа корпорации Дю
дующем виде:
пон (в дальнейшем модель Дюпон)является согласо
ванной методикой анализа способности предприятия
эффективно генерировать прибыль, реинвестиро
вать ее, наращивать обороты.
Эта модель позволяет исследовать динамику
ключевых показателей эффективности деятельности
предприятия:
Объем про
Прямые про
даж
изв. затраты
55

¿”ƒ»“ » ‘»Õ¿Õ—Œ¬¤… ¿Õ¿À»«
3`97
 (Sales)
 (Manufacturing
Cost)
Валовая при
Косвенные за
быль
траты
(Gross Profit)
 (Mkt. & Adm.
Expenses)
Оперативная
Проценты и на
прибыль
логи
 (Operating Profit)
(Interest & Tax)
Чистая прибыль
Дивиденды
 (Net Profit)
 (Dividend)
Реинвест.
прибыль
(Retained
Earnings)
Структура балансового отчета
Форматы балансового отчета
(Balance Sheet)
Существует несколько форматов балансового
Источники и направления использования фи
отчета:
нансов
1. Американский формат или традиционный
Источники (Sources):
балансовый отчет
1. Собственный капитал (Equity)
• Акционерный капитал (Common Stock)
Собственный капитал
Фиксированные
• Реинвестированная прибыль (Retain Earnings)
активы
2. Кредиты (Loans)
Долгосрочные кредиты
• Краткосрочные (Short Term)
Текущие
Текущие активы
• Долгосрочные (Long Term)
обязательства
• 
краткосрочные кредиты
Краткосрочные обязательства (Current
кредиторская задолжен
Liabilities)
ность
ИТОГО ПАССИВОВ (TOTAL CAPITAL)
Направления использования:
ВСЕГО ОБЯЗТЕЛЬСТВ
ВСЕГО АКТИВОВ
1. Фиксированные активы (Fixed Assets)
В формате для финансового анализа все за
2. Текущие активы (Current Assets)
емные процентные обязательства группируются.
ИТОГО АКТИВОВ (TOTAL ASSETS)
Данный формат удобен для изучения влияния, кото
рое оказывают на бизнес различные способы финан
сирования.
2. Британский или европейский формат
 
Òåêóùèå àêòèâû ìèíóñ
Ñîáñòâåííûé êàïèòàë
Ôèêñèðîâàííûå àêòè-
òåêóùèå îáÿçàòåëüñòâà
âû
(áåç ó÷åòà êðàòêîñðî÷-
 
íûõ êðåäèòîâ)
Êðåäèòû
 
äîëãîñðî÷íûå
Ðàáî÷èé êàïèòàë
êðàòêîñðî÷íûå
3. Формат для финансового анализа
 
Ôèêñèðîâàííûå àêòè-
Ñîáñòâåííûé êàïèòàë
âû
Òåêóùèå àêòèâû ìèíóñ
        ÂÑÅ
òåêóùèå îáÿçàòåëüñòâà
Ðàáî÷èé êàïèòàë
Äîëãîñðî÷íûå êðåäè-
(Working Capital)
òû
   ИНВЕСТИЦИОННЫЙ КАПИТАЛ
ЧИСТЫЕ АКТИВЫ
4. Взаимосвязь с отчетом о прибылях и убытках
Ñîáñòâåííûé êàïèòàë
àêöèîíåðíûé êàïèòàë
Ôèêñèðîâàííûå àêòè-
56
ðåèíâåñòèð. ïðèáûëü
âû
Êðåäèòû
äîëãîñðî÷íûå
Ðàáî÷èé êàïèòàë
Ðåèíâåñòèð. ïðè-
êðàòêîñðî÷íûå
áûëü
(ïîïàäàåò èç îò÷åòà

¿Õ¿À»« ›‘‘≈ “»¬ÕŒ—“»  »Õ¬≈—“»÷»…
       ВСЕГО КАПИТАЛА
     ЧИСТЫЕ АКТИВЫ
Подготовка российской финансовой
Актив
Пассив
отчетности к анализу в соответствии с
вые вложения
международными принципами
Прочие внеоборотные
Целевые финансирование и
активы
поступления
бухгалтерского учета (GAAP)
Нераспределенная прибыль
Одним из основополагающих принципов бух
отчетного года  Убытки
галтерского учета в большинстве стран является
БАЛАНС
БАЛАНС
принцип отражения учетных объектов по ценам при
Примечание: * Валюта баланса уменьшена на
обретения. В условиях стабильных цен применение
величину убытков.
этого принципа вполне оправдано. Однако в периоды
Следующим этапом подготовки отчетности
достаточно высокой инфляции отчетность, основан
предприятия к анализу является подготовка транс
ная на первоначальных стоимостных оценках, может
формированного баланса, построенного в соответ
давать искаженное представление о финансовом
ствии с принципами GAAP. Подготовка трансформи
состоянии и результатах деятельности предприятия,
рованного баланса не является самоцелью. Благода
более того, при анализе финансового состояния
ря укрупненной структуре статей трансформирован
предприятия за несколько отчетных периодов, кото
ного баланса во многом облегчается не только ана
рые характеризуются высоким уровнем инфляции,
лиз финансовых показателей деятельности компа
для получения достоверной информации необходи
нии, но и сам баланс приобретает более удобный для
мо данные финансовой отчетности за все анализи
анализа вид. Такие же или приблизительно такие же
руемые периоды привести к уровню цен выбранного
форматы балансового отчета используются на за
базового периода.
падных предприятиях. Основой для подготовки
В системе анализа Дюпон в программе Фин
трансформированного баланса на российских пред
эксперт реализована возможность пересчета данных
приятиях на сегодняшний день является обычный
финансовой отчетности в цены последнего анализи
бухгалтерский баланс, введенный с первого полуго
руемого временного периода. Для этого используют
дия 1998 года.
ся квартальные индексы инфляции.
Структура баланса GAAP
Актив
Пассив
Наименования позиций
Наименования позиций
ОБОРОТНЫЕ АКТИВЫ
КРАТКОСРОЧНЫЕ
ПАССИВЫ

Денежные средства
Заемные средства
Краткосрочные финансо
Кредиторская задолжен
вые вложения
ность
Дебиторская задолжен
Расчеты по дивидендам
ность
Запасы
Прочие краткосрочные пас
сивы
Прочие текущие активы
ДОЛГОСРОЧНЫЕ
ПАССИВЫ

ВНЕОБОРОТНЫЕ
Заемные средства
АКТИВЫ
Нематериальные активы
Прочие долгосрочные пас
сивы
Основные средства
КАПИТАЛ И РЕЗЕРВЫ
Незавершенное строи
Уставный капитал
тельство
Долгосрочные финансо
Накопленный капитал
57


 

А также другие работы, которые могут Вас заинтересовать

78152. Развитие и воспитание личности 55.36 KB
  Структура учебной деятельности: учебнопознавательные мотивы цели задачи и учебные действия. Обучение направлено на развитие личности посредством организации усвоения обучающимися научных знаний и способов деятельности. Воспитательная функция реализуется в формировании у обучающихся ценностных ориентаций убеждений личностных качеств в процессе усвоения социальнокультурного опыта и формировании мотивов учебной деятельности которые во многом определяют ее успешность. Используется в практике профессиональной подготовки и рассчитан на то...
78153. Роль и психологические функции руководителя в системе управления 55.01 KB
  Процесс принятия решений значительно более сложен и опосредован множеством различных обстоятельств и соображений не обязательно связанных с данной группой решения часто принимаются на основе прошлого опыта. Решения принимают непосредственно по групповой деятельности предпринимают постоянные попытки разработки новых и неоднозначных решений проблемы Сфера действий руководителя шире поскольку он представляет малую группу в более широкой социальной системе Сфера деятельности лидера в основном малая группа Однако несмотря на приведенные...
78154. Самосовершенствование личности 53.53 KB
  Самосовершенствование определяется взаимодействием человека с конкретной социальной средой в ходе которого он вырабатывает у себя такие качества которые дают успех в профессиональной деятельности и в жизни вообще. Рубинштейн трактовал жизненный путь не только как движение человека вперед но и движение вверх к высшим более совершенным формам и лучшим проявлениям человеческой сущности завершение жизни достижение не старости упадка и смерти а достижение личностного совершенства. Причем предъявляемые требования должны быть несколько...
78155. Система образования в Республике Беларусь: состояние и пути развития 45.34 KB
  Кодекс Республики Беларусь об образовании как главный законодательный документ в области образования. Позитивные и негативные тенденции и особенности функционирования системы образования на всех уровнях. Направление совершенствования высшего образования в Республике Беларусь.
78156. Социализация личности. Семейное воспитание 52.23 KB
  Признаки и функции коллектива методика его формирования. Признаки развитого коллектива: наличие общественно и личностно значимых целей; включение членов коллектива в разнообразную социальную деятельность; соответствующая организация совместной деятельности; связь коллектива с обществом; наличие положительных традиций и перспектив; атмосфера взаимопомощи доверия и требовательности; развитые критика и самокритика сознательная дисциплина и др. Это результат упорного целенаправленного и длительного труда всего коллектива результат...
78157. Социальная подструктура личности 33.17 KB
  Стадии социализации личности. Полученные в процессе социализации знания приобретенные личностные качества не станут лишь индивидуальным достоянием а станут достоянием общества так как человек не только обогащается опытом но и реализует себя как личность влияя на жизненные обстоятельства и окружающих людей. Механизмы социализации: Имитация механическое повторение воспроизведение наблюдаемых человеком социальных действий без понимания их подлинного смысла.
78158. Эмоции и психические состояния личности 115.54 KB
  Эмоции имеются и у животных но у человека они приобретают особую глубину имеют множество оттенков и сочетаний. Эмоции различают по интенсивности и длительности а также по степени осознанности причины их появления. В связи с этим выделяют: настроение собственно эмоции и аффекты.
78159. Биологическая и психологическая подструктуры личности 129.43 KB
  Механизмы развития и тренировки памяти. Этот образ соотносится с информацией хранящейся в памяти и мотивационными установками человека. информированность индивида об объекте представлений и продолжительность сохранения его образов: представления памяти т. Особенности памяти: память немыслима без других психических процессов так как она запечатляет сохраняет и воспроизводит психические продукты этих процессов когда мы воспринимаем чтото оно запоминается; память – это сквозной психический процесс так как присутствует в течение...
78160. Введение в курс «Основы психологии» 196.17 KB
  Психология и очень старая и совсем молодая наука. Начало превращения психологии в самостоятельную науку связывают с именем немецкого ученого Христиана Вольфа 1679-1754 опубликовавшего книги Рациональная психология 1732 и Экспериментальная психология 1734 в которых он использовал термин психология. психология окончательно выделилась в самостоятельную науку. Возникли такие ее отрасли как педагогическая юридическая военная управленческая спортивная психология и т.