18014

Бизнес-статистика и прогнозирование

Книга

Менеджмент, консалтинг и предпринимательство

В.Г. Минашкин Н.А. Садовникова Р.А. Шмойлова Бизнесстатистика и прогнозирование СОДЕРЖАНИЕ РАЗДЕЛ I. БИЗНЕССТАТИСТИКА..6 Глава 1. Предмет и метод статистики.6 Статистика как наука и отрасль практической д...

Русский

2013-07-06

2.23 MB

102 чел.

В.Г. Минашкин  Н.А. Садовникова Р.А. Шмойлова

Бизнес-статистика и прогнозирование

СОДЕРЖАНИЕ

РАЗДЕЛ I. БИЗНЕС-СТАТИСТИКА……………………………………..6

Глава 1. Предмет и метод статистики…………………………………….6

Статистика как наука и отрасль практической деятельности………………………………………………..6

Основные категории статистики………………………...8

Глава 2. Сводка и группировка статистических данных……………..11

 2.1. Задачи сводки и ее содержание………………………...11

2.2. Метод группировок и его место в системе статистических методов……………………………………..12

 2.3. Виды статистических группировок…………………...13

 2.4. Принципы построения статистических группировок14

2.5. Сравнимость статистических группировок. Вторичная группировка……………………………………..21

 2.6. Статистические таблицы и ее элементы……………...22

 2.7. Виды таблиц по характеру подлежащего……………..23

 2.8. Виды таблиц по разработке сказуемого………………24

 2.9. Правила построения статистических таблиц………..25

 2.10. Чтение и анализ статистической таблицы………….26

Глава 3. Теория статистических показателей………………………….28

 3.1. Абсолютные показатели………………………………...28

 3.2. Относительные показатели…………………………….29

 3.3. Средние показатели……………………………………...32

 3.4. Структурные средние……………………………………35

Глава 4. Показатели вариации в анализе социально-экономических явлений и процессов……………………………………………………….39

 4.1. Основные показатели вариации……………………….39

 4.2. Показатели вариации в анализе взаимосвязей………43

Глава 5. Статистическое изучение взаимосвязей социально-экономических явлений…………………………………………………...45

 5.1. Причинность, регрессия, корреляция………………...45

 5.2. Парная регрессия…………………………………...……48

 5.3. Множественная регрессия……………………………...49

 5.4. Параметрические методы изучения связей…………..52

 5.5. Принятие решений на основе уравнений регрессии..54

 5.6. Методы изучения связи качественных признаков….55

 5.7. Ранговые коэффициенты связи………………………..57

Глава 6. Индексный метод анализа……………………………………...59

 6.1. Общие понятия об индексах……………………………59

 6.2. Средние формы сводных индексов……………………62

6.3. Сводные индексы в анализе последовательных временных периодов…………………………………………63

 6.4. Индексный анализ влияния структурных изменений……… 64

РАЗДЕЛ II. Моделирование бизнес-процессов…………………………65

Глава 7. Априорный анализ компонент временного ряда……………65

  1.  Понятие и основные принципы экономико-статистического анализа…………………………………….65
    1.  Характеристика и принципы формирования информационной базы………………………………………67
    2.  Априорный анализ и его роль в статистическом моделировании………………………………………………..70

Глава 8. Теоретические аспекты моделирования и прогнозирования бизнес-процессов……………………………………………………………74

 

8.1. Система статистических понятий и категорий, применяемых в моделировании и прогнозировании бизнес-процессов……………………………………………...74

8.2.Модель как отображение действительности………….76

8.3. Сущность и классификация статистических прогнозов...…………………………………………………….78

8.4. Этапы построения статистических прогнозов……….82

Глава 9. Методологические аспекты оценки скорости и интенсивности изменения бизнес-процессов…………………………...84

9.1. Понятие о рядах динамики и их виды………………...84

9.2. Сопоставимость уровней и смыкание рядов динамики….….86

9.3. Аналитические показатели рядов динамики………...88

9.4. Средние показатели рядов динамики…………………90

Глава 10. Моделирование основных тенденций и закономерностей бизнес-процессов……………………………………………………………93

10.1. Особенности статистического анализа одномерных временных рядов по компонентам…………………………93

10.2. Методы выявления тенденции временного ряда…..99

10.3. Методы оценки типа тенденции…………………….104

10.4. Модели тенденции бизнес-процессов……………….107

10.5. Выбор формы тренда…………………………………108

Глава 11. Моделирование фактора случайности в бизнес-процессах.113

Глава 12.Моделирование периодической компоненты бизнес-процессов...…………………………………………………………………115

12.1. Методы выявления сезонной компоненты………...115

12.2. Модели сезонных колебаний………………………...118

Глава 13. Моделирование связных временных рядов……………….120

13.1. Проблема автокорреляции в анализе бизнес-процессов……………………………………………………..120

13.2. Модели авторегрессионных преобразований……..124

РАЗДЕЛ III. Прогнозирование тенденций в бизнес-процессах……..126

Глава 14. Прогнозирование на основе одномерных временных рядов

  1.  Простейшие методы прогнозирования…………....126
    1.  Прогнозирование на основе экстраполяции тренда131
    2.  Прогнозирование с учетом дисконтирования информации...…………………………………………133
    3.  Прогнозирование на основе кривых роста………..142
    4.  Прогнозирование рядов динамики, не имеющих тенденции……………………………………………...145

Глава 15. Прогнозирование многомерных временных рядов………147

Глава 16. Оценка точности и надежности прогнозов………………149

 

 

РАЗДЕЛ I. Бизнес-статистика

Глава 1. Предмет и метод бизнес-статистики

  1.  Статистика как наука и отрасль практической деятельности

Термин статистика имеет несколько значений. Под статистикой понимают отрасль практической деятельности по сбору, обработке, анализу и публикации статистической информации как в целом по стране, так и по отдельным ее регионам. Такая деятельность, с определенными различиями в используемой методологии, осуществляется во всех странах. В России эта работа выполняется Федеральной службой государственной статистики.

Статистикой также часто называют и сам результат статистической деятельности, т.е. массив статистических данных или обобщающие показатели, характеризующие состояние массовых явлений и процессов  по той или иной совокупности за определенный период. Потребителями статистической информации являются органы государственного управления, научные организации, информационные агентства, аналитические службы компаний и банков, физические лица. В последние годы стремительно повышается значение статистической информации в маркетинговых исследованиях.

В настоящее время статистика - это самостоятельная наука, включающая разветвленную систему научных дисциплин, изучающих количественную сторону массовых явлений и процессов в неразрывной связи с их качественной стороной в конкретных условиях места и времени с целью выявления социально-экономических типов явлений, изучения структуры совокупности, анализа взаимосвязей и взаимозависимостей между явлениями и признаками, их характеризующими.

Изучаемые статистикой явления и процессы многообразны.  В первую очередь, статистика изучает все, что связано с экономической деятельностью обществ. Статистические методы широко используются в анализе социальных процессов и явлений.

Методы статистики применяются в экономическом анализе, менеджменте, маркетинге, бизнес-планировании и в других областях научной и практической деятельности.

Рассмотрим отраслевую структуру статистики как науки.

Теория статистики (общая теория статистики) – это отрасль статистической науки, рассматривающая ее общие понятия, категории, принципы и методы сбора, обработки и анализа данных. Теорией статистики разрабатываются общие показатели и методы изучения структуры,  взаимосвязи и динамики изучаемых процессов и явлений. Использование этих показателей и методов в отдельных областях научной и практической деятельности наполняет их качественным содержанием, а в ряде случаев – придает им определенную специфику.

Экономическая (макроэкономическая) статистика  изучает количественные закономерности происходящих в экономике явлений и процессов, выявление основных пропорций и тенденций экономического развития на макроуровне, т.е. на уровне крупного региона или страны в целом. Экономическая статистика изучает как сам процесс воспроизводства материальных благ и услуг, так и его результаты, а также их воздействие на уровень жизни населения.

В соответствии с классификацией отраслей экономики в статистической науке и практике также выделяется отраслевой уровень. К отраслевым статистикам относятся:

  1.   статистика промышленности;
  2.   статистика сельского хозяйства;
  3.   статистика капитального строительства;
  4.   статистика услуг, транспорта и связи;
  5.   статистика торговли.

Статистика населения изучает численный и национальный состав, а также возрастно-половую структуру населения, его размещение и воспроизводство как  по стране в целом, так и в разрезе территориальных единиц.

Социальная статистика изучает социальную структуру населения, его уровень жизни и, в частности, доходы, а также уровень образования и культуры, состояния здоровья и медицинского обслуживания и другие социальные аспекты жизнедеятельности общества.

Для того, чтобы получить общее представление о статистической методологии, необходимо рассмотреть сам процесс статистического исследования, который включает четыре основных этапа:

1. Этап формирования информационной базы статистического исследования. На данном этапе осуществляется сбор первичного статистического материала, проверка его полноты и достоверности, который реализуется методами сплошного и несплошного статистического наблюдения. От качества полученных исходных статистических данных во многом зависят окончательные результаты всего статистического исследования.  

2. Этап предварительной обработки данных, который включает в себя подсчет групповых и общих итогов, расчет некоторых относительных показателей. Основной метод, используемый на данном этапе - метод группировок. В результате его реализации от больших массивов статистических данных осуществляется переход к компактным и удобным для анализа статистическим таблицам.

3. Этап расчета и интерпретации обобщающих статистических показателей. На данном этапе рассчитываются показатели среднего уровня и вариации, структуры, взаимосвязи и динамики изучаемых процессов и явлений.

4. Этап моделирование взаимосвязей и динамики социально-экономических процессов и явлений. На данном этапе строятся уравнения регрессии, трендовые модели, описывающие основные тенденции изменения изучаемых показателей.

Используемые в процессе реализации всех этапов статистические приемы и методы в целом составляют статистическую методологию исследования.

1.2. Основные категории статистики

Одной из важнейших категорией статистической науки является категория признака. Именно значения различных признаков наблюдаются и регистрируются на первой стадии статистического исследования - стадии статистического наблюдения. Признак - это объективная характеристика единицы статистической совокупности, характерная черта или свойство, которое может быть определено или измерено. Возможное значение, которое может принимать признак, называется вариантом. Признаки подразделяются на количественные и качественные, а последние, в свою очередь, на альтернативные, атрибутивные и порядковые.

Количественным называется признак, отдельные варианты которого имеют числовое выражение и отражают размеры, масштабы изучаемого объекта или явления.

Альтернативным называется признак, имеющий только два варианта значений.

Атрибутивный признак имеет  более двух вариантов, которые при этом выражаются в виде понятий или наименований, и не выражаются числом. Такие признаки имеют место в различных областях исследования, но в большей степени они характерны для информации, с которой работают маркетологи, социологи, психологи.

Порядковые признаки имеют несколько ранжированных, т.е. упорядоченных по возрастанию или убыванию. Отдельные варианты порядкового признака трудно соизмерить количественно. Порядковый признак может иметь числовое выражение.

Изучаемые статистикой признаки как правило подвержены вариации. Вариация – это колеблемость, изменяемость величины признака в статистической совокупности.

Статистической совокупностью называется множество подвергающихся статистическому исследованию объектов или явлений, объединенных общими признаками. Статистика изучает совокупности промышленных, сельскохозяйственных, строительных и торговых предприятий, коммерческих банков, населения страны или отдельного ее региона.

Индивидуальный составной элемент статистической совокупности, являющийся носителем изучаемых признаков, называется единицей совокупности.

Общее число единиц, образующих статистическую совокупность, называется объемом совокупности.

Объем совокупности следует отличать от объема признака,  т.е. суммарного значения признака по всем единицам изучаемой совокупности. В некоторых случаях объем признака не имеет реального экономического смысла. Но для расчета отдельных статистических показателей, в частности - средних, такое суммирование необходимо.

Одной из важнейших характеристик статистической совокупности является ее однородность. Однородной является совокупность, единицы которой близки между собой по значениям признаков, существенных для данного исследования, или же они относятся к одному и тому же типу. Многие методы и приемы статистического исследования применимы лишь к однородным совокупностям.

Большую роль в статистическом исследовании играет закон больших чисел, в силу которого количественные закономерности, присущие массовым явлениям, отчетливо проявляются лишь при достаточно большом числе наблюдений. Единичные явления в большей степени подвержены действию случайных и несущественных факторов, чем масса в целом. При большом числе наблюдений случайные отклонения от общей закономерности развития взаимно погашаются.  В результате взаимопогашения случайных отклонений обобщающие показатели, исчисленные для величин одного и того же вида, становятся типичными, отражающими действие постоянных и существенных факторов в данных условиях места и времени.

Статистическое исследование независимо от его масштабов и целей завершается расчетом и анализом различных по виду и форме выражения статистических показателей.

Статистический показатель представляет собой количественную характеристику социально-экономических явлений и процессов в условиях качественной определенности. Качественная определенность показателя заключается в том, что он непосредственно связан с внутренним содержанием изучаемого явления или процесса, его сущностью.

Как правило, изучаемые статистикой процессы и явления достаточно сложны, и их сущность не может быть отражена посредством одного отдельно взятого показателя. В таких случаях используется система статистических показателей.

Система статистических показателей - это совокупность взаимосвязанных показателей, имеющая одноуровневую или многоуровневую структуру и нацеленная на решение конкретной статистической задачи.

В отличие от признака статистический показатель получается расчетным путем. Это могут быть простой подсчет единиц совокупности, суммирование их значений признака, сравнение двух или нескольких величин, а также более сложные расчеты.

Различают конкретный статистический показатель и показатель-категорию. Конкретный статистический показатель характеризует размер, величину изучаемого явления или процесса в данном месте и в данное время. Однако в теоретических работах и на этапе проектирования статистического наблюдения оперируют показателями-категориями.

Показатель-категория отражает сущность, общие отличительные свойства конкретных статистических показателей одного и того же вида без указания места, времени и числового значения.

Все статистические показатели по охвату единиц совокупности разделяются на индивидуальные и сводные, а по форме выражения - на абсолютные, относительные и средние.

Индивидуальные показатели характеризуют отдельный объект или отдельную единицу совокупности - предприятие, фирму, банк, домохозяйство и т.п.

На основе соотнесения двух индивидуальных абсолютных показателей, характеризующих один и тот же объект или единицу, получают индивидуальный относительный показатель. В статистике рассчитываются и индивидуальные средние показатели, но только во временном измерении.

Сводные показатели характеризуют группу единиц, представляющую собой часть статистической совокупности или всю совокупность в целом. Эти показатели, в свою очередь, подразделяются на количественные (объемные), качественные и расчетные

Количественные (объемные) показатели получают путем суммирования значений признака отдельных единиц совокупности. Полученная величина, называемая объемом признака, выступает в качестве объемного абсолютного показателя.

Качественные показатели получают путем сравнения двух объемных показателей или объемом совокупности, даются в расчете на единицу чего-либо. Таким образом получают объемный относительный и объемный средний показатели.

Расчетные показатели, вычисляемые по различным формулам, служат для решения отдельных статистических задач анализа - измерения вариации, характеристики структурных сдвигов, оценки взаимосвязи и т.д. Они также делятся на абсолютные, относительные или средние.

Статистические показатели бывают моментными и интервальными. Моментные показатели отражают социально-экономические процессы и явления по состоянию на определенный момент времени, как правило, на определенную дату, начало или конец месяца, года. Интервальные показатели отражают социально-экономические процессы и явления за определенный период - день, неделю, месяц, квартал, год.

В зависимости от принадлежности к одному или двум объектам изучения различают однообъектные и межобъектные показатели. Однообъектные показатели характеризуют только один объект. Межобъектные показатели получают в результате сопоставления двух величин, относящихся к разным объектам. Межобъектные показатели выражаются в форме относительных или средних величин.

С точки зрения пространственной определенности статистические показатели подразделяются на общетерриториальные, характеризующие изучаемый объект или явление в целом по стране, региональные и местные (локальные), относящиеся к какой-либо части территории или отдельному объекту.

Глава 2. Сводка и группировка статистических данных

2.1. Задачи сводки и ее содержание

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Сводка - это научная обработка первичных данных с целью получения обобщенных характеристик изучаемого социально-экономического явления по ряду существенных для него признаков с целью выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

По глубине и точности обработки материала различают сводку простую и сложную.

Простая сводка - это операция по подсчету общих итогов по совокупности единиц наблюдения и оформление этого материала в статистических таблицах.

Сложная сводка -  это комплекс последовательных операций, включающих группировку полученных при наблюдении материалов, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов по каждой группе и подгруппе, и по всему объекту и представление результатов в виде статистических таблиц.

Проведение сводки включает следующие этапы:

выбор группировочного признака;

определение порядка формирования групп;

разработка системы статистических показателей для характеристики групп и объекта в целом;

разработка макетов статистических таблиц для представления результатов сводки.

По форме обработки материала сводка бывает:

централизованная, когда весь первичный материал поступает в одну организацию, подвергается в ней обработке от начала до конца;

децентрализованная, когда отчеты предприятий сводятся статистическими органами субъектов РФ, а полученные итоги поступают в Росстат РФ и там определяются итоговые показатели в целом по народному хозяйству страны.

По технике выполнения статистическая сводка бывает механизированная (с использованием средств электронно-вычислительной техники) и ручная.

2.2. Метод группировок и его место в системе статистических методов

Группировкой называется разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на однородные группы, различающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализировать связи между отдельными признаками. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

С помощью метода группировок решаются следующие задачи:

выделение социально-экономических типов явлений;

изучение структуры явления и структурных сдвигов, происходящих в нем;

выявление взаимосвязи и взаимозависимости между явлениями.

2.3. Виды статистических группировок

 В соответствии с познавательными задачами, решаемыми в ходе построения статистических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка - это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида основное влияние должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться  на основе анализа сущности изучаемого социально-экономического явления.

Структурной называется группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и  признаками, их характеризующими, называется аналитической группировкой.

В статистике при изучении связей социально-экономических явлений и процессов признаки необходимо делить на факторные и результативные.

Факторными называются признаки, под воздействием которых изменяются другие результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака возрастает или убывает значение признака результативного и наоборот.

Особенностями построения аналитической группировки являются:

  •  единицы статистической совокупности группируются по факторному признаку;
  •  каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные.

Простой называется группировка, в которой группы образованы только по одному признаку.

Комбинационной называется группировка, в которой разбиение совокупности на группы производится по двум и более признакам, взятым в  сочетании (комбинации).

Сначала группы формируются по одному признаку, затем группы делятся на подгруппы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупности одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последовательности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.

2.4. Принципы построения статистических группировок

Построение статистических группировок осуществляется по следующим этапам:

  1.  определение группировочного признака;
  2.  определение числа групп;
  3.  расчет ширины интервала группировки;
  4.  определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки.

В основание группировки могут быть положены как количественные, так и качественные признаки. Количественные признаки это признаки, которые имеют числовое выражение. Качественные признаки отражают состояние единицы совокупности.

Число групп зависит от:

- задач исследования;

- вида показателя, положенного в основание группировки;

- объема изучаемой совокупности

- степени вариации признака.

Вид показателя существенен особенно при анализе качественных признаков.  В случае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объем совокупности и степень колеблемости группировочного признака.

При небольшом объеме совокупности не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оценить вариацию признака между крайними значениями признака – максимальным (Xmax) и минимальным (Xmin) и определяется по следующей формуле:

                                                    R=Xmax-Xmin.

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано  большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы наблюдения.

Построение большого числа групп позволит, с одной стороны, точнее воспроизвести характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенностей объекта и показателей, его характеризующих, и цели исследования.

Определение числа групп можно осуществить несколькими способами. Формально математический способ предполагает  использование формулы Стерджесса:

n = 1 + 3,322 lg N,                                                                        (2.1)

где  n - число групп

N - число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной  формулы  дает хорошие результаты, в том случае, если совокупность состоит из большого числа единиц наблюдения.

Когда определено число групп, то следует определить интервалы группировки.

 Интервал группировки - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака  в интервале.  Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь неравные интервалы подразделяются на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного признака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

                 (2.2)

где  хmax, xmin - максимальное и минимальное значения признака в совокупности;

n -число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (2.2) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (2.2) представляет собой величину, которая имеет один знак до запятой, то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала.  Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой, то это значение необходимо округлить до целого числа.

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50.

Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами. Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необходимость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно возрастающие или прогрессивно убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии определяются следующим образом:

hi+1 = hi + a,

а в геометрической прогрессии:

hi+1 = hi  q,

где  а - константа: для прогрессивно-возрастающих интервалов  имеет знак «+», а  при прогрессивно-убывающих  - знак «-».

q - константа:  для прогрессивно – возрастающих – больше «1»; для прогрессивно-убывающих – меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми  называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

Открытые - это интервалы, у которых указана только одна граница: как правило, верхняя - у первого интервала и  нижняя - у последнего. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений  изучаемого признака.

При группировке единиц совокупности по количественному признаку границы интервалов могут быть обозначены по-разному, в зависимости от того, непрерывный  или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов. Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно использовать открытые интервалы. В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала.

Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1-го интервала, увеличенной на 1.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами. Специализированные интервалы  - это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно возрастающими, ни прогрессивно убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.

Ряды распределения представляют собой простейшую группировку, в которой каждая выделенная группа характеризуется одним показателем.

Статистический ряд распределения - это упорядоченное количественное распределение единиц совокупности на однородные группы по какому - либо варьирующему (атрибутивному или количественному) признаку.

В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, характеризующим состояние изучаемого явления и не имеющим числового выражения.

Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку, т.е. признаку, имеющему числовое выражение у отдельных единиц совокупности. Вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака. Частотами называются численности отдельных вариант или каждой группы вариационного ряда. Частоты показывают, как часто встречаются те или иные значения признака в изучаемой совокупности. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.

Дискретный вариационный ряд - это ряд распределения в котором группы составлены по признаку, изменяющемуся прерывно, т.е. через определенное число единиц и характеризуют распределение единиц совокупности по дискретному признаку, принимающему только целые значения.

Интервальный вариационный ряд распределения – это ряд распределения, в котором группировочный признак, составляющий основание группировки, может принимать в интервале любые значения, отличающиеся друг от друга на сколь угодную малую величину.

Построение интервальных вариационных рядов целесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация признака проявляется в широких пределах, то есть число вариантов дискретного признака достаточно велико.

Правила построения рядов распределения аналогичны правилам построения группировки.

Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения.

Полигон используется при изображении дискретных вариационных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот. Полученные на пересечении оси абсцисс (х) и оси ординат (у) точки соединяются прямыми линиями, в результате чего получают ломаную линию, называемую полигоном частот. Иногда для замыкания полигона предлагается крайние точки (слева и справа на ломаной линии) соединить с точками на оси абсцисс, в результате чего получается многоугольник.

Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенным на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам. В результате  получается график, на котором ряд распределения изображен в виде смежных друг с другом столбиков.

Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить прямыми линиями.

При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Это необходимо сделать для устранения влияния величины интервала на распределение интервала и получения возможности сравнивать частоты. Плотность распределения - это частота, рассчитанная на единицу  ширины интервала, то есть, сколько единиц в каждой группе приходится на единицу величины интервала.

Для графического изображения вариационных рядов может использоваться кумулятивная кривая. При помощи кумуляты  изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам. Накопленные частоты показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.

При построении кумуляты интервального вариационного ряда по оси абсцисс (х) откладываются варианты ряда, а по оси ординат (у) накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, то есть кумуляту.

Если при графическом изображении вариационного ряда в виде кумуляты оси х и у поменять местами, то получим огиву.

2.5. Сравнимость статистических группировок.

Вторичная группировка

Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.

Вторичная группировка, или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа.

Вторичная группировка - операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.

2.6. Статистическая таблица и ее элементы

Результаты сводки и группировки материалов статистического наблюдения, как правило, представляются в виде таблиц.

Таблица является наиболее рациональной, наглядной и компактной формой представления статистического материала.

Однако, не всякая таблица является статистической. Таблица умножения, опросный лист социологического обследования и так далее, могут носить табличную форму, но еще не являются статистическими таблицами.

Статистической называется таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа.

Основные элементы статистической таблицы, составляющие ее остов (основу), показаны на схеме 2.1.

Табличной называется такая форма расположения числовой информации, при которой число располагается на пересечении четко сформулированного заголовка по вертикальному столбцу, называемому графой, и названия по соответствующей горизонтальной полосе - строке. Внешне таблица представляет собой пересечение граф и строк, которые формируют остов таблицы.

Статистическая таблица содержит три вида заголовков: общий, верхние и боковые. Общий заголовок отражает содержание всей таблицы (к какому месту и времени она относится), располагается над макетом таблицы по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) - строк. Они являются внутренними заголовками.

Остов таблицы, заполненный заголовками, образует макет таблицы; если на пересечении граф и строк записать цифры, то получается полная статистическая таблица.

Название таблицы

(общий заголовок)

*) Примечания к таблице.

Схема 2.1. Остов (основа) статистической таблицы

 

Цифровой материал может быть представлен абсолютными, относительными и средними величинами.

Таблицы могут сопровождаться примечанием, используемым с целью пояснения, в случае необходимости, заголовков, методики расчета некоторых показателей, источников информации и так далее.

По логическому содержанию таблица представляет собой «статистическое предложение», основными элементами которого являются подлежащее и сказуемое.

Подлежащим статистической таблицы называется объект, который характеризуется цифрами. Это может быть одна или несколько совокупностей, отдельные единицы совокупности в порядке их перечня или сгруппированные по каким-либо признакам, территориальные единицы и так далее. Обычно подлежащее таблицы дается в левой части, в наименовании строк.

Сказуемое статистической таблицы образует система показателей, которыми характеризуется объект изучения, то есть подлежащее таблицы. Сказуемое формирует верхние заголовки и составляет содержание граф с логически последовательным расположением показателей слева направо.

Расположение подлежащего и сказуемого в отдельных случаях может меняться местами для более полного и лучшего способа прочтения и анализа исходной информации об исследуемой совокупности.

2.7. Виды таблиц по характеру подлежащего

В практике экономико-статистического анализа используются различные виды статистических таблиц.

В зависимости от структуры подлежащего, от группировки единиц в нем, различают статистические таблицы простые и сложные, а последние, в свою очередь, подразделяются на групповые и комбинационные.

Простой  называется такая таблица, в подлежащем которой дается перечень каких-либо объектов или территориальных единиц.

Простые таблицы различают монографические и перечневые. Монографические таблицы характеризуют не всю совокупность единиц изучаемого объекта, а только одну какую-либо группу из нее, выделенную по определенному признаку.

Простыми перечневыми таблицами называются таблицы, подлежащее которых содержит перечень единиц изучаемого объекта.

Подлежащее простой таблицы может быть сформировано по видовому; территориальному; временному и так далее принципам.

Простые таблицы не дают возможности выявить социально-экономические типы изучаемых явлений, их структуру, а также взаимосвязи и взаимозависимости между характеризующими их признаками.

Эти задачи более полно могут быть решены с помощью сложных - групповых и, особенно, комбинационных таблиц.

Групповыми называются статистические таблицы, подлежащее которых содержит группировку единиц совокупности по одному количественному или атрибутивному признаку.

Простейшим видом групповых таблиц являются ряды распределения. Групповая таблица может быть более сложной, если в сказуемом дополнительно приводятся ряд показателей, характеризующих группы подлежащего. Такие таблицы часто используются в целях сопоставления обобщающих показателей по группам.

Таким образом, групповые таблицы позволяют выявить и охарактеризовать социально-экономические типы явлений, их структуру в зависимости только от одного признака.

Комбинационными называются статистические таблицы, подлежащее которых содержит группировку единиц совокупности одновременно по двум и более признакам: каждая из групп, построенная по одному признаку, разбивается, в свою очередь, на подгруппы по какому-либо другому признаку и так далее.

Комбинационные таблицы позволяют характеризовать типические группы, выделенные по нескольким признакам и связь между ними. Последовательность разбиения единиц совокупности на однородные группы по признакам определяется либо важностью одного из них  в их комбинации, либо порядком их изучения.

2.8. Виды таблиц по разработке сказуемого

В сказуемом статистической таблицы приводятся показатели, которые являются характеристикой изучаемого объекта.

По структурному строению сказуемого различают статистические таблицы с простой и сложной его разработкой.

При простой разработке сказуемого, показатель, определяющий его, не подразделяется на подгруппы и итоговые значения получаются путем простого суммирования значений по каждому признаку отдельно, независимо друг от друга.

Сложная разработка сказуемого предполагает деление признака, формирующего его, на подгруппы. При сложной разработке сказуемого явление или объект могут быть охарактеризованы различной комбинацией признаков, формирующих их.

Исследователь при построении статистических таблиц должен руководствоваться оптимальным соотношением показателей сказуемого.

2.9. Правила построения статистических таблиц

Статистические таблицы, как средство наглядного и компактного представления цифровой информации, должны быть статистически правильно оформлены.

Основными приемами, определяющими технику формирования статистических таблиц, являются следующие:

1. Таблица должна быть компактной и содержать только те данные, которые непосредственно отражают исследуемое явление в статике и динамике и необходимы для познания его сущности. Цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева направо и сверху  вниз;

2. Заголовок таблицы и названия граф и строк должны быть четкими, краткими, лаконичными, представлять собой законченное целое, органично вписывающееся в содержание текста. В названии таблицы должны найти отражение объект, признак, время и место совершения события.

3. Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой. Существуют различные способы соединения слагаемых граф с их итогом:

строка «Итого» или «Всего» завершает статистическую таблицу;

итоговая строка располагается первой строкой таблицы и соединяется с совокупностью ее слагаемых словами «В том числе».

4. Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то необходимо им присвоить объединяющий заголовок.

5. Графы и строки полезно нумеровать. Графы слева, заполненные названием строк, принято обозначать заглавными буквами алфавита (А), (В) и так далее, а все последующие графы - номерами в порядке возрастания.

6. Взаимосвязанные данные, характеризующие одну из сторон анализируемого явления целесообразно располагать в соседних друг с другом графах.

7. Графы  и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям.

8. Числа целесообразнее, по возможности, округлять. Округление чисел в пределах одной и той же графы или строки следует проводить с одинаковой степенью точности.

Если все числа одной и той же графы или строки даны с одним десятичным знаком, а одно из чисел имеет точно два знака после запятой, то числа с одним знаком после запятой следует дополнять нулем, тем самым подчеркнув их одинаковую точность.

9. Отсутствие данных об анализируемом социально-экономическом явлении может быть обусловлено различными причинами и это по-разному отмечается:

а) если данная позиция (на пересечении соответствующих графы и строки) вообще не подлежит заполнению, то ставится знак «Х»;

б) если по какой-либо причине отсутствуют сведения, то ставится многоточие «...» или «нет свед.»;

в) если отсутствует явление, то клетка заполняется тире (-). Для отображения очень малых чисел используют обозначения (0,0) или (0,00.

10. В случае необходимости дополнительной информации - разъяснений к таблице, могут даваться примечания.

Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления,  обработки и обобщения статистической информации о состоянии и развитии анализируемых социально-экономических явлений.

2.10. Чтение и анализ статистической таблицы

Анализу статистических таблиц предшествует этап ознакомления - чтения их.

«Чтение» предполагает, что исследователь, прочитав слова и числа таблицы, усвоил ее содержание в целом, сформулировал первые суждения об объекте, уяснил назначение таблицы, дал оценку явлению или процессу, описанному в таблице.

Анализ предполагает реализацию  двух его направлений - структурного и содержательного.

Структурный анализ предполагает анализ строения таблицы и характеристику представленных в ней:

совокупности и единиц наблюдения, формирующих ее;

признаков и их комбинации, формирующих подлежащее и сказуемое таблицы;

признаков - количественные или атрибутивные;

соотношение признаков подлежащего с показателями сказуемого;

вида таблицы - простая или сложная, а последняя - групповая или комбинационная;

решаемых задач - анализ структуры, типов явлений или их взаимосвязей.

Содержательный анализ предполагает изучение  внутреннего содержания таблицы: анализ отдельных групп подлежащего по соответствующим признакам сказуемого; выявление соотношений и пропорций между группами явлений по одному и разным признакам; сравнительный анализ и формулировка выводов по отдельным группам и по всей совокупности в целом, установление закономерностей и определение резервов развития изучаемого объекта.

Прежде чем приступить к анализу числовой информации, необходимо проверить ее достоверность и научную обоснованность, источники ее получения. Должна быть произведена проверка данных: логическая и счетная - выборочный расчет отдельных значений признаков по группе, либо итоговых значений.

Анализ отдельных признаков и групп необходимо начинать с изучения абсолютных величин, затем - связанных с ними относительных величин.

Анализ таблиц может быть дополнен расчетными относительными и средними величинами, графиками, диаграммами и т.д., если этого требуют задачи исследования.

Анализ данных таблиц производится по каждому признаку в отдельности, а затем в логико-экономическом сочетании признаков.

Соблюдение правил и последовательности работы со статистическими таблицами позволит исследователю осуществить научно-обоснованный экономико-статистический анализ объектов и процессов.

Глава 3. Теория статистических показателей

3.1. Абсолютные показатели

Статистический показатель представляет собой количественную характеристику социально-экономических явлений и процессов в условиях качественной определенности. Качественная определенность показателя заключается в том, что он непосредственно связан с внутренним содержанием изучаемого явления или процесса, его сущностью. Расчет и интерпретация получаемых в ходе исследования статистических показателей – важнейшая часть статистической работы.

Исходной, первичной формой выражения статистических показателей являются показатели в абсолютном выражении или абсолютные величины. Статистические показатели в форме абсолютных величин характеризуют абсолютные размеры изучаемых статистикой процессов и явлений.

Индивидуальные абсолютные показатели, как правило, получают непосредственно в процессе статистического наблюдения как результат замера, взвешивания, подсчета и оценки интересующего количественного признака. В ряде случаев индивидуальные абсолютные показатели имеют разностный характер.

Сводные абсолютные  показатели, характеризующие объем признака или объем совокупности как в целом по изучаемому объекту, так и по какой-либо его части, получают в результате сводки и группировки индивидуальных значений.

Абсолютные статистические показатели всегда являются именованными числами. В зависимости от социально-экономической сущности исследуемых явлений, их физических свойств они выражаются в натуральных, стоимостных или трудовых единицах измерения.

В международной практике используются такие натуральные единицы измерения как тонны, килограммы, квадратные, кубические и простые метры, мили, километры, галлоны, литры, штуки и т.д.

В группу натуральных также входят условно-натуральные измерители, используемые в тех случаях, когда какой-либо продукт имеет несколько разновидностей и общий объем можно определить только исходя из общего для всех разновидностей потребительского свойства.

Перевод в условные единицы измерения осуществляется на основе специальных коэффициентов, рассчитываемых как отношение потребительских свойств отдельных разновидностей продукта к эталонному значению.

В условиях рыночной экономики наибольшее значение и применение имеют стоимостные единицы измерения, позволяющие получить денежную оценку социально-экономических явлений и процессов.

К трудовым единицам измерения, позволяющим учитывать как общие затраты труда на предприятии, так и трудоемкость отдельных операций технологического процесса, относятся человеко-дни и человеко-часы.

3.2. Относительные показатели

Относительный показатель представляет собой результат деления одного абсолютного показателя на другой и выражает соотношение между количественными характеристиками социально-экономических процессов и явлений. Поэтому, по отношению к абсолютным показателям, относительные показатели или показатели в форме относительных величин являются производными, вторичными. Без относительных показателей невозможно измерить интенсивность развития изучаемого явления во времени, оценить уровень развития одного явления на фоне других взаимосвязанных с ним явлений, осуществить пространственно-территориальные сравнения, в том числе и на международном уровне.

При расчете относительного показателя абсолютный показатель, находящийся в числителе получаемого отношения, называется текущим или сравниваемым. Показатель же, с которым производится сравнение и который находится в знаменателе, называется основанием или базой сравнения. Таким образом, рассчитываемая относительная величина показывает, во сколько раз сравниваемый абсолютный показатель больше базисного, или какую составляет от него долю, или сколько единиц первого приходится на 1, 100, 1000 и т. д. единиц второго.

Относительный показатель, полученный в результате соотнесения разноименных абсолютных показателей, является величиной именованной. Его наименование представляет собой сочетание наименований сравниваемого и базисного показателей.

Все используемые на практике относительные статистические показатели можно подразделить на следующие виды:

1) динамики;

2) плана;

3) реализации плана;

4) структуры;

5) координации;

6) интенсивности и уровня экономического развития;

7) сравнения.

Относительный показатель динамики (ОПД) представляет собой отношение уровня исследуемого процесса или явления за данный период времени (по состоянию на данный момент времени) к уровню этого же процесса или явления в прошлом:

Рассчитанная таким образом величина показывает, во сколько раз текущий уровень превышает предшествующий (базисный) или какую долю от последнего составляет. Данный показатель может быть выражен кратным отношением или переведен в проценты.

Различают относительные показатели динамики с постоянной и переменной базой сравнения. Если сравнение осуществляется с одним и тем же базисным уровнем, например, первым годом рассматриваемого периода, получают относительные показатели динамики с постоянной базой (базисные). При расчете относительных показателей динамики с переменной базой (цепных) сравнение осуществляется с предшествующим уровнем, т.е. основание относительной величины последовательно меняется.

Относительные показатели динамики с переменной и постоянной базой сравнения взаимосвязаны между собой следующим образом: произведение всех относительных показателей с переменной базой равно относительному показателю с постоянной базой за исследуемый период.

Относительные показатели плана и реализации плана. Все субъекты финансово-хозяйственной деятельности, от небольших индивидуальных частных предприятий и до крупных корпораций, в той или иной степени осуществляют как оперативное, так и стратегическое планирование, а также сравнивают реально достигнутые результаты с ранее намеченными. Для этой цели используются относительные показатели плана (ОПП) и реализации плана (ОПРП):

Первый из этих показателей характеризует относительную высоту планового уровня, т.е. во сколько раз намечаемый объемный показатель  превысит достигнутый уровень или сколько процентов от этого уровня составит. Второй показатель отражает фактический объем производства или реализации в процентах или коэффициентах по сравнению с плановым уровнем.

Между относительными показателями плана, реализации плана и динамики существует следующая взаимосвязь:

ОПП ОПРП = ОПД

Относительный показатель структуры представляет собой соотношение структурных частей изучаемого объекта и их целого:

Выражается относительный показатель структуры в долях единицы или в процентах. Рассчитанные величины, соответственно называемые долями или удельными весами, показывают, какой долей обладает или какой удельный вес имеет та или иная часть в общем итоге.

Относительный показатель координации представляет собой отношение одной части совокупности к другой части этой же совокупности:

При этом в качестве базы сравнения выбирается та часть, которая имеет наибольший удельный вес или является приоритетной с экономической, социальной или какой-либо другой точки зрения. В результате получают, во сколько раз данная часть больше базисной или сколько процентов от нее составляет, или сколько единиц данной структурной части приходится на 1 единицу (иногда - на 100, 1000 и т.д. единиц) базисной структурной части.

Относительный показатель интенсивности характеризует степень распространения изучаемого процесса или явления и представляет собой отношение исследуемого показателя к размеру присущей ему среды:

Данный показатель получают сопоставлением уровней двух взаимосвязанных в своем развитии явлений. Поэтому, наиболее часто он представляет собой именованную величину, но может быть выражен и в процентах, промилле, продецимилле.

Разновидностью относительных показателей интенсивности являются относительные показатели уровня экономического развития, характеризующие производство продукции в расчете на душу населения и играющие важную роль в оценке развития экономики государства или региона.

Относительный показатель сравнения представляет собой соотношение одноименных абсолютных показателей, характеризующих разные объекты (предприятия, фирмы, районы, области, страны и т.п.):

Для выражения данного показателя могут использоваться как коэффициенты, так и проценты.

 

3.3. Средние показатели

 

Наиболее распространенной формой статистических показателей, используемой в экономических исследованиях, является средняя величина, представляющая собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени. Показатель в форме средней величины выражает типичные черты и дает обобщающую характеристику однотипных явлений по одному из варьирующих признаков. Он отражает уровень этого признака, отнесенный к единице совокупности.

Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности колеблются в ту или иную сторону под влиянием множества факторов, среди которых могут быть как основные, так и случайные. Сущность средней в том и заключается, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием факторов основных. Это позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам.

Типичность средней непосредственным образом связана с однородностью статистической совокупности. Средняя величина только тогда будет отражать типичный уровень признака, когда она рассчитана по качественно однородной совокупности.

На практике определить среднюю во многих случаях можно через исходное соотношение средней (ИСС) или ее логическую формулу:

Для каждого показателя, используемого в экономическом анализе, можно составить только одно истинное  исходное соотношение для расчета средней.

         Однако от того, в каком виде представлены исходные данные для расчета средней, зависит, каким именно образом будет реализовано ее исходное соотношение. В каждом конкретном случае для реализации исходного соотношения потребуется одна из следующих форм средней величины:

средняя арифметическая,

средняя гармоническая,

средняя геометрическая,

средняя хронологическая;

средняя квадратическая, кубическая и т.д.

Перечисленные средние объединяются в общей формуле средней степенной (при различной величине k):

  i=

где  х i - i-ый вариант осредняемого признака (i=)

f i - вес i-го варианта.

Кроме степенных средних в экономической практике также используются средние структурные, среди которых наиболее распространены мода и медиана.

Наиболее распространенным видом средних величин является средняя арифметическая, которая, как и все средние, в зависимости от характера имеющихся данных может быть простой или взвешенной.

Средняя арифметическая простая используется в тех случаях, когда расчет осуществляется по несгруппированным данным, и имеет вид:

  (3.1)

Средняя арифметическая взвешенная. При расчете средних величин отдельные значения осредняемого признака могут повторяться, встречаться в совокупности несколько раз. В подобных случаях расчет средней производится по сгруппированным данным, то есть данным представленным в виде дискретных или интервальных вариационных рядов распределения.

Средняя арифметическая взвешенная определяется по формуле:

                         (3.2)

В отдельных случаях веса могут быть представлены не абсолютными величинами, а относительными (в процентах или долях единицы):

      .                    (3.3)

Таким образом, среднюю арифметическую невзвешенную можно использовать в том случае, когда точно установлено отсутствие весов или их равенство.

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам путем определения средней арифметической простой между нижней и верхней границами каждого интервала.

Свойства средней арифметической. Средняя арифметическая обладает некоторыми математическими свойствами, более полно раскрывающими ее сущность и в ряде случаев используемыми при ее расчете. Рассмотрим эти свойства:

1. Произведение средней на сумму частот равно сумме произведений отдельных вариантов на соответствующие им частоты:

   (3.4)

2. Сумма отклонений индивидуальных значений признака от средней арифметической равна нулю:

   (3.5)

3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем сумма квадратов их отклонений от любой другой произвольной величины С.

4. Если все осредняемые варианты уменьшить или увеличить на постоянное число А, то средняя арифметическая соответственно уменьшится или увеличится на ту же величину:

                                   (3.6)

5. Если все варианты значений признака уменьшить или увеличить в А раз, то средняя также соответственно увеличится или уменьшится в А раз:

                          (3.7)

6. Если все веса уменьшить или увеличить в А раз, то средняя арифметическая от этого не изменится:

               (3.8)

Исходя из данного свойства, можно заключить, что если все веса равны между собой, то расчеты по средней арифметической взвешенной и средней арифметической невзвешенной приведут к одному и тому же результату.

Средняя гармоническая взвешенная используется, когда известен числитель исходного соотношения средней, но неизвестен его знаменатель, определяется по формуле:

, где wi=xifi                    (3.9)

Данная формула используется для расчета средних показателей не только в статике, но и в динамике, когда известны индивидуальные значения признака и веса W за ряд временных интервалов.

Средняя гармоническая невзвешенная. Эта форма средней, используемая значительно реже, имеет следующий вид:

                               (3.10)

Средняя геометрическая:

  - невзвешенная   (3.11)

 - взвешенная

Наиболее широкое применение этот вид средней получил в анализе динамики для определения среднего темпа роста, что будет рассмотрено в соответствующей главе.

Средняя квадратическая:

                                     - невзвешенная            (3.12)

         - взвешенная

Наиболее широко этот вид средней используется при расчете показателей вариации.

 

3.4. Структурные средние

К структурным средним величинам  в статистике относят моду, медиану и квартили, квинтили, децили, перцентили.

Медиана – это значение признака, находящийся в середине ранжированной (упорядоченной по возрастанию или убыванию) совокупности. Медиана делит изучаемую совокупность на две равные части – у половины единиц совокупности значение признака меньше медианы, а у другой половины единиц совокупности значение признака больше медианы.

Медиана является центром распределения. Основное свойство медианы заключается в том, что сумма абсолютных отклонений фактических значений от медианы меньше, чем от любой другой величины:

,

где  - i-тый вариант признака,

       - значение медианы.

Медиана может быть определена для количественных и порядковых признаков. Расчет медианы для альтернативных и атрибутивных признаков невозможен, так как эти признаки нельзя ранжировать.

Порядок расчета медианы:

1. расположить данные в порядке возрастания (или убывания) значений признака;

2 определить номер медианной единицы

,                                                                         (3.13)

где - номер медианной единицы,

      n –число единиц совокупности;

3. определить медиану, т.е. значение признака соответствующее номеру медианной единицы.

Расчет медианы зависит от:

- характера исходных данных, а именно, от четного или нечетного числа единиц совокупности;

- от вида признака (количественный или порядковый);

- формы представления исходных данных (не сгруппированные данные, дискретный ряд распределения, интервальный ряд распределения).

Медиана количественного признака для интервального ряда распределения определяется по формуле:

,                                               (3.14)

где  - нижняя граница медианного интервала;

     i –величина интервала;

       - накопленная частота интервала, предшествующего медианному;

      - частота медианного интервала;

      - число единиц совокупности.

Медианным является интервал, первая накопленная частота которого превышает половину объема совокупности.

Мода – значение признака, наиболее часто встречающееся в совокупности.

Расчет моды для несгруппированных данных состоит в определении наиболее часто встречающегося значения. Если два и более варианта признака встречаются чаще остальных, то будет соответственно несколько модальных значений.

Расчет моды для дискретного ряда распределения состоит в определении признака имеющего наибольшую частоту.

Моду для интервального ряда распределения определяют по формуле:

,                                    (3.15)

где  - нижняя граница модального интервала;

    i –величина модального интервала;

     - частота модального интервала;

     - частота интервала, предшествующего модальному;

    - частота интервала, следующего за модальным.

Модальным называется интервал с наибольшей частотой.

Расчет моды для порядковых и атрибутивных признаков не представляет сложности с математической точки зрения и состоит в определении значения признака, которое встречается чаще остальных.

Средняя, медиана и мода характеризуют типичное значение признака в изучаемой совокупности. Вместе с тем каждый из перечисленных показателей имеет свою экономическую интерпретацию и особенности применения. Использование перечисленных показателей зависит от вида признака и характера распределения.

В анализе распределений порядковых признаков используют медиану и моду. Порядковые данные не имеют среднего значения. Типичное значение порядкового признака может быть выражено с помощью медианы и моды. При этом медиана отражает значение признака наиболее близкого ко всем единицам совокупности, а мода, характеризует наиболее распространение значение признака.

В анализе распределений количественных признаков для однородной совокупности обычно рассчитывают все три показателя. При этом соотношение  значений средней, медианы и моды позволяют судить о характере распределения. Если данные

Рис. 3.1.Симметричное распределение

распределены симметрично, то значения средней медианы и моды совпадают (рис. 3.1.) Если распределение характеризуется ассиметрией, то значения средней и медианы отличаются. В распределениях с левосторонней ассиметрией значение средней меньше значений медианы и моды. В распределениях с правосторонней ассиметрией значение средней больше значений медианы и моды (рис. 3.2)

Рис. 3.2. Правосторонняя ассиметрия

Аномальные значения (значения существенно отличающиеся от других) не влияют на расчет медианы, но могут оказать существенное влияние на среднее значение признака. Поэтому, медиана является наиболее предпочтительной, по сравнению со средней величиной, характеристикой типичного уровня признака неоднородных совокупностей.

Квартили – это значения признака в упорядоченной совокупности, которые делят совокупность на четыре равные части. Первая или нижняя квартиль () характеризует значение признака, меньше которого расположено 25% единиц совокупности, а больше – 75%. Вторая квартиль соответствует медиане (), т.е. у 50% единиц совокупности значение признака меньше второй квартили, а у 50% - больше. Третья или верхняя квартиль () характеризует значение признака, меньше которого расположено 75% единиц совокупности, а больше – 25%.

Квинтили – это значения признака в упорядоченной по возрастанию совокупности, которые делят совокупность на пять равных частей. Первая или нижняя квинтиль () характеризует значение признака, меньше которого расположено 20% единиц совокупности, а больше – 80%. Четвертая или верхняя квинтиль () характеризует значение признака, меньше которого расположено 80% единиц совокупности, а больше – 20%.

Децили – это значения признака в упорядоченной по возрастанию совокупности, которые делят совокупность на десять равных частей. Первая или нижняя дециль () характеризует значение признака, меньше которого расположено 10% единиц совокупности, а больше – 90%. Девятая или верхняя дециль () характеризует значение признака, меньше которого расположено 90% единиц совокупности, а больше – 10%.

Перцентили – это значения признака в упорядоченной по возрастанию совокупности, которые делят совокупность на сто равных частей.

Глава 4. Показатели вариации в анализе социально-экономических явлений и процессов

4.1. Основные показатели вариации

Вариация значений признака представляет наибольший интерес при исследовании социально-экономических явлений и процессов.

Используемые в статистическом анализе показатели вариации можно разделить на три группы:

  •  показатели размаха;
  •  показатели, характеризующие отклонения от среднего уровня;
  •  относительные показатели вариации.

К показателям размаха относят:

  - вариационный размах;

- децильный размах;

- квартильный размах.

К показателям, характеризующим отклонения от среднего уровня, относят:

- среднее линейное отклонение;

- среднее квадратическое отклонение;

- дисперсию.

К относительным показателям относят:

- относительный квартильный размах;

- линейный коэффициент вариации;

- коэффициент вариации.

Вариационный размах или размах вариации характеризует абсолютную разницу между максимальным и минимальным значениями признака в изучаемой совокупности:

                                                                          (4.1)

Основным недостатком данного показателя является то обстоятельство, что максимальные и минимальные значения признака могут быть обусловлены случайными обстоятельствами и в этой связи могут искажать типичный для изучаемой совокупности размах вариации.

Децильный размах (D) характеризует абсолютную разницу между значениями девятой (верхней) и первой (нижней) децилями:

                                                              (4.2)

Таким образом, децильный размах характеризует разброс 80% данных и, является более предпочтительным по сравнению с вариационным размахом, так как практически не зависит от экстремальных значений.

Квартильный размах или интерквартильный разбрас (interquartile rang - IQR) характеризует абсолютную разницу между третьим (верхним) и первым (нижним) квартилями:

                                                                      (4.3)

Третья или верхняя квартиль (Q3) показывает значение признака больше которого расположено 25% значений. Таким образом квартильный размах характеризует разброс 50% центральных значений.

Среди показателей разброса наиболее часто в практическом анализе используют квартильный размах.

Показатели разброса графически можно представить в виде секционной диаграммы (boxplot). В секционной диаграмме пунктирная линия представляет медиану, прямоугольник характеризует квартильный разброс, а вертикальные линии, выходящие из прямоугольника (их часто называют «усами»), характеризуют границы разброса. Если в данных нет аномальных значений, то «усы» соответствуют минимальному и максимальному значениям признака. Обычно к аномальным значениям относят данные, отклонения которых от нижнего и верхнего квартиля больше чем в 1,5 раза превышают квартильный разброс. Если такие данные существуют, то они показываются в виде отдельных точек. В этом случае «усы» принимаются равными

нижний:                                                    (4.4)

верхний:                                                   (4.5)

Среднее линейное отклонение. Для абсолютной количественной оценки различий между всеми без исключения значениями признака в изучаемой совокупности используется оценка отклонений фактических значений от их среднего уровня. Чем больше различия между вариантами признака, тем больше и их отклонения от среднего уровня. Однако, как отмечалось в главе «Средние показатели», сумма отклонений фактических значений от средней всегда равна 0. Существует два основных подхода к усреднению отклонений фактических значений от средней. Первый состоит в том, что используют абсолютные значения отклонений и в результате получают показатель который называется среднее линейное отклонение. Второй состоит в том, что отклонения возводят в квадрат и в результате получают дисперсию и среднее квадратическое отклонение.

Среднее линейное или среднее абсолютное отклонение (mean absolute deviation – ) представляет собой среднее арифметическое из абсолютных значений отклонений фактических вариантов признака от среднего значения. В зависимости от характера исходных данных для расчета используют простую или взвешенную форму:

        - простая форма;                               (4.6)

  - взвешенная форма,                         (4.7)

Если данные не сгруппированы, то используют простую формулу, если сгруппированы – то взвешенную.

Дисперсия (variance) представляет собой средний квадрат отклонений значений признака от средней величины.

В зависимости от характера исходных данных для расчета используют простую или взвешенную формулу:

   - простая форма;                                           (4.8)

  - взвешенная форма,                                (4.9)

Для расчета дисперсии в отдельных случаях удобнее использовать формулу, которая представляет собой алгебраическое преобразование выражений (4.8) и (4.9):

, где                                                           (4.10)

- средняя квадратическая.

В зависимости от характера исходных данных для расчета средней квадратической используются простая или взвешенная формы:

- простая,                                                               (4.11)

- взвешенная.                                                  (4.12)

Если данные не сгруппированы, то используют простую форму, если сгруппированы – то взвешенную.

Возведение отклонений фактических значений от средней в квадрат приводит к тому, что дисперсия имеет тоже наименования, что и изучаемый признак, но возведенное в квадрат. Это затрудняет экономическую интерпретацию полученных результатов. Поэтому наиболее удобным и широко распространенным на практике показателем вариации является среднее квадратическое отклонение, которое определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.

Среднее квадратическое отклонение характеризует среднее отклонение фактических значений признака в статистической совокупности от их среднего значения и рассчитывается на основе следующих формул:

  - простая форма,                                       (4.13)

                                          - взвешенная форма                             (4.14)

                                                                          (4.15)

Среднее квадратическое отклонение также называют стандартным отклонением (standard deviation).

Среднее квадратическое отклонение и среднее линейное отклонение близки друг другу по экономическому смыслу и между ними есть определенная связь. Для симметричных или умеренно ассиметричных распределений .

Среднее квадратическое отклонение более широко применяется в статистическом анализе по сравнению со средним линейным отклонением благодаря своим математических свойствам. Так среднее квадратическое отклонение является одним из параметров многих распределений и в первую очередь нормального распределения. В нормальном распределении примерно 2/3 всех значений отклоняются от среднего уровня не больше, чем на одну величину среднего квадратического отклонения. Приблизительно 95% всех значений отклоняются от среднего уровня не более чем на две величины среднего квадратического отклонения. И, наконец, около 99,7% всех значений лежат в пределах трех средних квадратических отклонений.

Коэффициенты вариации. Рассмотренные выше показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. Чтобы оценить масштабы вариации используют относительные показатели вариации, которые измеряют изменчивость значений признака в относительном выражении по сравнению со средним уровнем, что во многих случаях является более предпочтительным. Для оценки относительных размеров вариации используют линейный коэффициент вариации и квадратический коэффициент вариации. Последний показатель получил более широкое распространение, поэтому его обычно называют коэффициент вариации, опуская слово квадратический. Относительные показатели вариации, как правило, рассчитывают в процентах.

Линейный коэффициент вариации измеряют через соотношение среднего линейного отклонения и средней:

                                                                         (4.16)

Коэффициент вариации измеряют через соотношение среднего квадратического отклонения и средней:

                                                                             (4.17)

Информативность показателей вариации повышается, если они рассчитываются для целей сравнительного анализа. При этом показатели, рассчитанные по одной совокупности, сопоставляются с показателями, рассчитанными по другой аналогичной совокупности или по той же самой, но относящейся к другому периоду времени. Например, исследуется динамика вариации курса доллара по годам или по месяцам или сравнивается вариация показателей компаний различных отраслей или регионов.

4.2 Показатели вариации в анализе взаимосвязей 

Показатели вариации могут быть использованы не только в анализе колеблемости изучаемого признака, но и для оценки степени влияния одного признака на вариацию другого признака, т.е. в анализе взаимосвязей между показателями.

При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками - факторным и результативным.

Для выявления взаимосвязи исходная совокупность делится на две или более группы по факторному признаку. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. При этом применяется правило сложения дисперсий:

                                               (4.18)

где   - общая дисперсия;

 - средняя из внутригрупповых дисперсий;

 - межгрупповая дисперсия.

Межгрупповая дисперсия отражает ту часть вариации результативного признака, которая обусловлена воздействием признака факторного. Это воздействие проявляется в отклонении групповых средних от общей средней:

                                       (4.19)

где   - среднее значение результативного признака  по i-ой группе;

- общая средняя по совокупности в целом;

 - объем (численность) i-ой группы.

Если факторный признак, по которому производилась группировка, не оказывает никакого влияния не признак результативный, то групповые средние будут равны между собой и совпадут с общей средней. В этом случае межгрупповая дисперсия будет равна нулю.

Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка:

                                          (4.20)

где   -дисперсия результативного признака в i-ой группе;

-объем (численность) i-ой группы.   

Теснота связи между факторным и результативным признаком оценивается на основе эмпирического корреляционного отношения:

                                         (4.21)

Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.

Глава 5. Статистическое изучение взаимосвязи социально-экономических явлений

5.1. Причинность, регрессия, корреляция

 

Исследование объективно существующих связей между социально-экономическими явлениями и процессами является важнейшей задачей теории статистики. В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие основное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения - это такая связь явлений и процессов, когда изменение одного из них - причины ведет к изменению другого - следствия.

Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо выявлять главные, основные причины, абстрагируясь от второстепенных.

Статистическое изучение связи включает следующие этапы:

  •  Качественный анализ, связанный с анализом природы социального или экономического явления методами экономической теории, социологии, конкретной экономики;
  •  Построение модели связи. Реализация данного этапа базируется на методах статистики: группировках, средних величинах,  и т.д.
  •  Интерпретация результатов. Данный этап связан с качественными особенностями изучаемого явления.

Статистика разработала множество методов изучения связей. Выбор метода изучения связи зависит от познавательной цели и задач исследования.

Признаки по их сущности и значению для изучения взаимосвязи делятся на факторные и результативные. Признаки, обуславливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, называются результативными.

В статистике различают функциональную и стохастическую зависимости. Функциональной  называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно  значение результативного признака.

Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является  корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

Связи между явлениями и их признаками классифицируются по степени тесноты, направлению и аналитическому выражению.

По степени тесноты связи различают (табл.5.1):

Таблица 5.1

Количественные критерии оценки тесноты связи

Величина показателя связи

Характер связи

До 0,3

практически отсутствует

0,3 - 0,5

слабая

0,5 - 0,7

умеренная

0,7 - 1,0

сильная

По направлению выделяют связь прямую и обратную. Прямая - это связь, при которой с увеличением или с уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного признака. Обратная – это связь, при которой с увеличением или с уменьшением значений одного признака происходит уменьшение или увеличение значений другого признака.

По аналитическому выражению выделяют связи прямолинейные (или просто линейные) и нелинейные. Если статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии, то ее называют линейной связью вида:

     (5.1)

Если же связь может быть выражена уравнением какой-либо кривой линии, то такую связь называют нелинейной или криволинейной, например:

параболы -      (5.2)

                        гиперболы -; и т.д., то такую связь называют нелинейной или криволинейной.

Для выявления наличия связи, ее характера и направления в статистике используются методы: приведения параллельных данных; графический; аналитических группировок; корреляции, регрессии.

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере.

Графически  взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группи

роваться точки вокруг определенной линии, выражающей форму связи.

Рис. 5.1. График корреляционного поля

Корреляция - это статистическая зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

В статистике принято различать следующие варианты зависимостей:

  1.  Парная корреляция - связь между двумя признаками (результативным и факторным, или двумя факторными).
  2.  Частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.
  3.  Множественная корреляция - зависимость результативного и двух или более факторных признаков, включенных в исследование.

Корреляционный анализ имеет своей задачей количественное определение тесноты и направления связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции, которые, давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии. Знаки при коэффициентах корреляции характеризуют направление связи между признаками.

Регрессия тесно связана с корреляцией и позволяет исследовать аналитическое выражение взаимосвязи между признаками.

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторных признаков).

Одной из проблем построения уравнений регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. В то же время, построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс.

При построении моделей регрессии должны соблюдаться следующие требования:

1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.

2. Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.

3. Все факторные признаки должны иметь количественное (числовое) выражение.

4. Наличие достаточно большого объема исследуемой выборочной совокупности.

5. Причинно-следственные связи между явлениями и процессами должны описываться линейной или приводимой к линейной форме зависимостью.

6. Отсутствие количественных ограничений на параметры модели связи.

7. Постоянство территориальной и временной структуры изучаемой совокупности.

Соблюдение данных требований позволяет построить модель, наилучшим образом описывающую реальные социально-экономические явления и процессы.

5.2. Парная регрессия  

Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: результативным и факторным.

Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.

Оценка параметров уравнений регрессии (a0, a1, и a2 - в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (a0 , a1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

                                       S = (-)min

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

      (5.3)

где n - объем исследуемой совокупности (число единиц наблюдения).

В уравнениях регрессии параметр a0  показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков. Коэффициент регрессии a1 показывает, на сколько  в среднем изменяется значение результативного признака при увеличении факторного признака на единицу собственного измерения.

 

5.3. Множественная (многофакторная) регрессия

 

Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии:

Построение моделей множественной регрессии включает несколько этапов:

  1.  Выбор формы связи (уравнения регрессии);
  2.  Отбор факторных признаков;
  3.  Обеспечение достаточного объема совокупности.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.

Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков.

С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.

Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе интуитивно-логических или многомерных математико-статистических методов анализа.

Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в реализации алгоритмов последовательного “включения”, “исключения” или “включения-исключения” факторов в уравнение регрессии и последующей проверке их статистической значимости. Алгоритм “включения” заключается в том, что факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости  введенного фактора определяется, на сколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции (R2). Одновременно используется и алгоритм последовательного «исключения», сущность которого заключается в том, что исключаются факторы, ставшие незначимыми по статистическим критериям.

Фактор является незначимым,  если его включение в уравнение регрессии только изменяет значения коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициента регрессии не изменяется (или меняется несущественно), то данный признак существенен и его включение в уравнение регрессии необходимо. В противном случае, фактор нецелесообразно включать в модель регрессии.

При построении модели регрессии возможна проблема мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель .

Наличие мультиколлинеарности между признаками приводит к:

искажению величины параметров модели, которые имеют тенденцию к завышению, чем осложняется процесс определения наиболее существенных факторных признаков;

изменению смысла экономической интерпретации коэффициентов регрессии.

В качестве причин возникновения мультиколлинеарности  между признаками, можно выделить следующие:

Изучаемые факторные признаки являются характеристикой одной и той же стороны изучаемого явления или процесса.

Факторные признаки являются составляющими элементами друг друга.

Факторные признаки по экономическому смыслу дублируют друг друга.

Устранение мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или нескольких линейно-связанных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы.

Вопрос о том, какой из факторов следует отбросить, решается на основании качественного,  логического анализа изучаемого явления, а также на основе анализа тесноты связи между результативным (y) c каждым из сильно коллинеарно связанных факторных признаков. Из дальнейшего анализа целесообразно исключить тот факторный признак, связь которого с результативным наименьшая.

Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.

Аналитическая форма связи результативного признака от нескольких факторных выражается и называется многофакторным (множественным) уравнением регрессии или моделью связи.

Линейное уравнение множественной регрессии  имеет вид:

где - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;

- факторные признаки;

- параметры модели (коэффициенты регрессии).

Параметры уравнения могут быть определены графическим методом, методом наименьших квадратов и так далее.

5.4. Параметрические методы изучения связи

Измерение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений. Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множественных зависимостей) факторных признаков.

Линейный коэффициент корреляции  характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости.

В теории разработаны и на практике применяются различные модификации формулы расчета данного коэффициента:

      (5.4)

Производя расчет по итоговым значениям исходных переменных, линейный коэффициент корреляции можно вычислить по формуле:

 (5.5)

Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость, выражаемая формулой:

        (5.6)

где  - коэффициент регрессии в уравнении связи;

 - среднее квадратическое отклонение соответствующего, статистически существенного, факторного признака.

Линейный коэффициент корреляции изменяется в пределах от -1 до 1: []. Знаки коэффициентов регрессии и корреляции совпадают. При этом интерпретацию выходных значений коэффициента корреляции можно осуществлять следующим образом (табл.5.2):

Таблица 5.2

Оценка линейного коэффициента корреляции

Значение линейного коэффициента связи

Характеристика связи

Интерпретация связи

r = 0

отсутствует

-

0<r<1

прямая

с увеличением x увеличивается y

-1<r<0

обратная

с увеличением x уменьшается y и наоборот

r=1

функциональная

каждому значению факторного признака строго соответствует одно значение результативного признака

В случае наличия линейной и нелинейной зависимости между двумя признаками для измерения тесноты связи применяют так называемое корреляционное отношение. Различают эмпирическое и теоретическое корреляционное отношение.

Эмпирическое корреляционное отношение рассчитывается по данным группировки, когда  характеризует отклонения групповых средних результативного показателя от общей средней:

   (5.7)

где  - корреляционное отношение;

  - общая дисперсия;

  - средняя из частных (групповых) дисперсий;

  - межгрупповая дисперсия (дисперсия групповых средних).

Все эти дисперсии есть дисперсии результативного признака.

Теоретическое корреляционное отношение определяется по формуле:

    (5.8)

где  - дисперсия выровненных значений результативного признака, то есть рассчитанных по уравнению регрессии;

  - дисперсия эмпирических (фактических) значений результативного признака.

Корреляционное отношение изменяется в пределах от 0 до 1 . Для измерения тесноты связи при множественной корреляционной зависимости, то есть при исследовании трех и более признаков одновременно, вычисляется множественный и частные коэффициенты корреляции.

Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативным и несколькими факторными признаками, а также между каждой парой факторных признаков.

Множественный коэффициент корреляции для двух факторных признаков вычисляется по формуле:

 (5.9)

где  - парные коэффициенты корреляции между признаками.

Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: .

Приближение  к единице свидетельствует о сильной зависимости между признаками.

Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками  и  при фиксированном значении других  факторных признаков, то есть когда влияние исключается, то есть оценивается связь между  и  в «чистом виде».

В случае зависимости  от двух факторных признаков  и  коэффициенты частной корреляции имеют вид:

                         (5.10)

где - парные коэффициенты корреляции между указанными в индексе переменными.

В первом случае исключено влияние факторного признака , во втором - .

 

5.5. Принятие решений на основе уравнений регрессии

Интерпретация моделей регрессии осуществляется методами той отрасли знаний, к которой относится исследуемое явление. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки значимости входящих в модель факторных признаков.

Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый.

Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак плюс, то с увеличением данного фактора результативный признак возрастает; если факторный признак имеет знак минус, то с его увеличением результативный признак уменьшается.

Если экономическая теория подсказывает, что факторный признак должен иметь положительное значение, а он имеет знак минус, то необходимо проверить расчеты параметров уравнения регрессии. Такое явление чаще всего бывает в силу допущенных ошибок при решении. Однако следует иметь ввиду, что когда рассматривается совокупное влияние факторов, то в силу наличия взаимосвязей между ними характер их влияния может меняться.

С целью расширения возможностей экономического анализа, используются частные коэффициенты эластичности, определяемые по формуле:

     (5.11)

где  - среднее значение соответствующего факторного признака;

  - среднее значение результативного признака;

  - коэффициент регрессии при соответствующем факторном признаке.

Коэффициент эластичности показывает на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1%.

Частный коэффициент детерминации:

        (5.12)

где  - парный коэффициент корреляции между результативным и - ым факторным признаком;

  - соответствующий стандартизованный коэффициент уравнения множественной регрессии:                                                    (5.13)

Частный коэффициент детерминации показывает на сколько процентов вариация результативного признака объясняется вариацией - го признака, входящего в множественное уравнение регрессии.

Наиболее полная экономическая интерпретация моделей регрессии позволяет выявить резервы развития и повышения деловой активности субъектов экономики.

5.6. Методы изучения связи качественных признаков

При наличии соотношения между вариацией качественных признаков говорят об их ассоциации, взаимосвязанности. Для оценки связи в этом случае используют ряд показателей.

Коэффициент ассоциации и контингенции. Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции.

Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, то есть состоящим из двух качественно отличных друг от друга значений признака.

Таблица 5.3

Таблица для вычисления коэффициентов ассоциации и контингенции

a

b

a+b

c

d

c+d

a+c

b+d

a+b+c+d

 Коэффициенты вычисляются по формулам:

ассоциации:                                                                              (5.14)

контингенции:                           (5.15)

Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если  или .

Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициента взаимной сопряженности Пирсона-Чупрова. Этот коэффициент вычисляется по следующей формуле:

;            (5.16)

где  - показатель взаимной сопряженности;

 - определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот, соответствующего столбца и строки. Вычитая из этой суммы «1», получим величину :

;

 - число значений (групп) первого признака;

 - число значений (групп) второго признака.

Чем ближе величина  и Kч  к 1, тем теснее связь.

Таблица 5.4

Вспомогательная таблица для расчета коэффициента

взаимной сопряженности

              у

  х

I

II

III

Всего

I

II

III

Итого

Особое значение для оценки связи имеет биссериальный коэффициент корреляции, который дает возможность оценить связь между качественным альтернативным и количественным варьирующим признаками. Данный коэффициент вычисляется по формуле:

                      (5.17)

где  и  - средние в группах;

 - среднее квадратическое отклонение фактических значений признака от среднего уровня;

      - доля первой группы;

      - доля второй группы;

    - табулированные (табличные) значения -распределения в зависимости от .

Величина биссериального коэффициента корреляции также подтверждает умеренную тесноту связи между изучаемыми признаками.

5.7. Ранговые коэффициенты связи

 

В анализе социально-экономических явлений часто приходится прибегать к различным условным оценкам с помощью рангов, а взаимосвязь между отдельными признаками измерять с помощью непараметрических коэффициентов связи.

Ранжирование - это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения.

Ранг - это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Если значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической из соответствующих номеров мест, которые они определяют. Данные ранги называются связными.

Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты Спирмена() и Кендалла (). Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками.

Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается по формуле:

                              (5.18)

где  - квадраты разности рангов;

 - число наблюдений (число пар рангов).

Коэффициент Спирмена принимает любые значения в интервале .

Ранговый коэффициент корреляции Кендалла () также может использоваться для измерения взаимосвязи между качественными и количественными признаками, характеризующими однородные объекты и ранжированные по одному принципу. Расчет рангового коэффициента Кендалла осуществляется по формуле:

                  (5.19)

где  - число наблюдений;

 - сумма разностей между числом последовательностей и числом инверсий по второму признаку.

Расчет данного коэффициента выполняется в следующей последовательности:

1. Значения  ранжируются в порядке возрастания или убывания;

2. Значения  располагаются в порядке, соответствующем значениям ;

3. Для каждого ранга определяется число следующих за ним значений рангов, превышающих его величину. Суммируя таким образом числа определяется величина , как мера соответствия последовательностей рангов по  и  и учитывается со знаком (+);

4. Для каждого ранга определяется число следующих за ним значений рангов, меньших его величины. Суммарная величина обозначается через  и фиксируется со знаком (-);

5. Определяется сумма баллов по всем членам ряда.

Как правило, коэффициент Кендалла меньше коэффициента Спирмена. При достаточно большом объеме совокупности значения данных коэффициентов имеют следующую зависимость:

Связь между признаками признается статистически значимой, если значения коэффициентов ранговой корреляции Спирмена и Кендалла больше 0,5.

Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент ранговой корреляции (коэффициент конкордации) , который вычисляется по формуле:

                                    (5.20)

где  - количество факторов

 - число наблюдений

 - отклонение суммы квадратов рангов от средней квадратов рангов.

Ранговые коэффициенты Спирмена, Кендалла и конкордации имеют то преимущество, что с помощью их можно измерять и оценивать связи как между количественными так и между атрибутивными признаками, которые поддаются ранжированию

Глава 6. Индексный метод анализа

6.1. Общие понятия об индексах

«Индекс» в переводе с латинского - указатель или показатель. В статистике индексом называют показатель относительного изменения данного уровня исследуемого явления по сравнению с другим его уровнем, принятым за базу сравнения. В качестве такой базы может быть использован или уровень за какой-либо прошлый период времени (динамический индекс), или уровень того же явления по другой территории (территориальный индекс). Индексы являются незаменимым инструментом исследования в тех случаях, когда необходимо сравнить во времени или  пространстве две совокупности, элементы которых  непосредственно суммировать нельзя.

В целом, индексный метод направлен на решение следующих задач:

1. характеристика общего изменения уровня сложного социально-экономического явления;

2. анализ влияния каждого из факторов на изменение индексируемой величины путем элиминирования воздействия прочих факторов;

3. анализ влияния структурных сдвигов на изменение индексируемой величины.

В дальнейшем изложении индексного метода будут использоваться следующие общепринятые обозначения:

i - индивидуальный индекс;

I - сводный индекс;

p - цена;

q - количество;

1 - текущий период;

0 - базисный период.

Простейшим показателем, используемым в индексном анализе, является индивидуальный индекс, который характеризует изменение во времени экономических величин, относящихся к одному объекту:

=  -   индивидуальный индекс цены,

где  - цена товара в текущем периоде;

- цена товара в базисном периоде;

Изменение физической массы проданного товара в натуральном выражении измеряется индивидуальным индексом физического объема реализации:

.

Изменение стоимостного объема товарооборота по данному товару отразится в значении индивидуального индекса товарооборота. Для его расчета товарооборот текущего периода (произведение цены на количество проданного товара) сравнивается с товарооборотом предшествующего периода:

.

Данный индекс также может быть получен как произведение индивидуального индекса цены и индивидуального индекса физического объема реализации.

Индивидуальные индексы, в сущности, представляют собой относительные показатели динамики или темпы роста, и по данным за несколько периодов времени могут рассчитываться в цепной или базисной формах.

В отличие от индексов индивидуальных, сводные индексы позволяют обобщить показатели по нескольким товарам. Исходной формой сводного индекса является агрегатная форма.

Агрегатная форма индекса позволяет найти для разнородной совокупности такой общий показатель, в котором можно объединить все ее элементы. При анализе динамики цен индивидуальные цены различных товаров складывать неправомерно,  но суммировать товарооборот по этим товарам вполне допустимо. В текущем периоде такой товарооборот по n товарам составит:

Аналогично получим для базисного периода:

Если мы сравним товарооборот в текущем периоде с его величиной в базисном периоде, то получим сводный индекс товарооборота:

                                                   (6.1)

Величина индекса товарооборота формируется под воздействием двух факторов – на нее оказывает влияние как изменение цен на товары, так и изменение объемов их реализации. Для того, чтобы оценить изменение только цен (индексируемой величины), необходимо количество проданных товаров (веса индекса) зафиксировать на каком-либо постоянном уровне. При исследовании динамики таких показателей как цена и себестоимость физический объем реализации обычно фиксируют на уровне текущего периода. Таким способом получают сводный индекс цен (по методу Пааше):

                                  (6.2)

Рассмотрим сводный индекс цен более подробно. Числитель данного индекса содержит фактический товарооборот текущего периода. Знаменатель же представляет собой условную величину, показывающую каким был бы товарооборот в текущем периоде при условии сохранения цен на базисном уровне. Поэтому соотношение этих двух категорий и отражает имевшее место изменение цен.

Числитель и знаменатель сводного индекса цен также можно интерпретировать и по-другому. Числитель представляет собой сумму денег, фактически уплаченных покупателями за товары в текущем периоде. Знаменатель же показывает, какую сумму покупатели заплатили бы за те же товары, если бы цены не изменились.  Разность числителя и знаменателя будет  отражать величину экономии (если знак «-») или перерасхода («+») покупателей региона от изменения цен.

Необходимо отметить, что в статистической практике также используется сводный индекс цен, построенный по методу Ласпейреса, когда веса или объемы продаж фиксируются на уровне базисного, а не текущего периода:

                                                                 (6.3)

Третьим индексом в рассматриваемой индексной системе (включающий индекс цен, рассчитанный по методу Паше) является сводный индекс физического объема реализации. Он характеризует изменение количества проданных товаров не в денежных, а в физических единицах измерения. Весами в данном случае выступают цены, которые фиксируются на базисном уровне:

                                                               (6.4)

Между рассчитанными индексами существует следующая взаимосвязь:

.

На основе данной взаимосвязи по значениям двух известных индексов всегда можно определить неизвестное значение третьего индекса.

6.2. Средние формы сводных индексов

На практике при расчете индексов часть необходимой информации может отсутствовать или базироваться на результатах выборочных обследований. В подобных случаях вместо индексов в агрегатной форме удобнее использовать средние арифметические и средние гармонические индексы. Любой сводный индекс можно представить как среднюю взвешенную из индивидуальных индексов. Однако при этом форму средней нужно выбрать таким образом, чтобы полученный средний индекс был тождественен исходному агрегатному индексу.

Предположим, мы располагаем данными о стоимости проданной продукции в текущем периоде и индивидуальными индексами цен, полученными, например, в результате выборочного наблюдения. Тогда при расчете сводного индекса цен по методу Пааше можно использовать следующую замену:

В целом же сводный индекс цен в данном случае будет выражен в форме средней гармонической:

                                                      (6.5)

Для получения значения, соответствующего индексу Ласпейреса, индекс цен необходимо представить в среднеарифметической форме.  При этом используется следующая замена:

 

С учетом этой замены сводный индекс цен в среднеарифметической форме можно представить следующим образом:

                                                           (6.6)

Среднеарифметическая форма также может использоваться при расчете сводного индекса физического объема товарооборота. При этом производится замена:

Тогда сводный индекс физического объема товарооборота имеет вид:

                                                           (6.7)

6.3. Сводные индексы в анализе последовательных временных периодов

На практике, как правило, расчет индексов не является разовой акцией. Индексы позволяют получать сводную оценку изучаемых процессов постоянно, месяц за месяцем, год за годом. Однако при этом для достижения сопоставимости они должны рассчитываться по единой методологии. Такая методология или схема расчета индексов за несколько последовательных временных периодов называется системой индексов.

В зависимости от информационной базы и целей исследования индексная система может строится по-разному. Рассмотрим некоторые варианты ее построения их на примере сводного индекса цен, рассчитываемого за n периодов.

Если сравнивать цены каждого периода с ценами периода предшествующего получаемая индексная система будет включать цепные индексы, отражающие изменение цен за каждый из периодов рассматриваемого временного интервала. При этом в качестве весов можно использовать объемы реализации каждого конкретного периода или же постоянные объемы какого-либо периода, принятого в качестве базисного. Тогда индексная система будет включать индексы, соответственно, с переменными или с постоянными весами. Цепные индексы цен с переменными весами имеют следующий вид:

         . . . .             

При использовании постоянных весов система преобразуется:

         . . .      

Отметим, что использование постоянных весов более предпочтительно, так как рассчитываемые таким образом индексы мультипликативны, т.е. их можно последовательно перемножать и получать величину показателя за более продолжительный период. Так, например, располагая индексами цен за три последовательных месяца можно получить сводную оценку изменения цены в целом за квартал и т.п. Индексы с переменными весами такой возможности не предоставляют.

Если сравнивать цены каждого периода с ценами какого-либо базисного периода (как правило – начального) получаемая индексная система будет включать базисные индексы, отражающие изменение цен накопленным итогом, т.е. с начала рассматриваемого временного интервала. Например, изменение цен в январе по сравнению с декабрем предшествующего года, в феврале – по сравнению с тем же декабрем и т.д. При этом в качестве весов также можно использовать объемы реализации каждого конкретного периода или же постоянные объемы периода, принятого в качестве базисного. Система базисных индексов с переменными весами имеет следующий вид:

            . . . .       

Базисные индексы цен с постоянными весами рассчитываются по формулам:

           . . . .     

Отметим, что использование постоянных весов приводит базисные индексы, так же как и индексы цепные, к сопоставимому виду.

6.4. Индексный анализ  влияния структурных изменений

Индексы позволяют оценить динамику показателей, характеризующих разнородные в качественном отношении совокупности, как правило, товарные группы. Однако, даже если рассматриваемая совокупность однородна (товар или вид продукции одного вида) на величине результативного показателя будет отражаться влияние структурных изменений, например, изменений в структуре производства или реализации данного товара по территориям.

Индекс цен переменного состава представляет собой соотношение средних значений  за два рассматриваемые периода:

                         (6.8)

Оценить воздействие этого фактора можно с помощью индекса структурных сдвигов:

.                                      (6.9)

Последним в данной системе является индекс цен фиксированного состава, который не учитывает влияние структуры:

                                                  (6.10)

Взаимодействие рассматриваемых факторов отражается в следующей взаимосвязи:

.

РАЗДЕЛ II. МОДЕЛИРОВАНИЕ БИЗНЕС-ПРОЦЕССОВ

Глава 7. Априорный анализ компонент временного ряда

7.1. Понятие и основные принципы экономико-статистического анализа

Анализ и обобщение данных исследования - заключительный этап статистического исследования, конечной целью которого является получение теоретических выводов и практических заключений о тенденциях и закономерностях изучаемых социально-экономических явлений и процессов.

Анализ - это метод научного исследования объекта путем рассмотрения его отдельных сторон и составных частей.

Экономико-статистический анализ - это разработка методики, основанной на широком применении традиционных статистических и математико-статистических методов с целью контроля адекватного отражения исследуемых явлений и процессов.

Задачами анализа являются: определение и оценка специфики и особенностей изучаемых явлений и процессов, изучение их структуры, взаимосвязей и закономерностей их развития.

В качестве этапов статистического анализа выделяются:

формулировка цели анализа;

критическая оценка данных;

сравнительная оценка и обеспечение сопоставимости данных ;

формирование обобщающих показателей;

фиксация и обоснование существенных свойств, особенностей,

сходств и различий, связей и закономерностей изучаемых

явлений и процессов;

формулировка заключений, выводов и практических

предложений о резервах и перспективах развития изучаемого

явления.

Методы анализа должны меняться в зависимости от характера изучаемых процессов, их специфики, особенностей и форм проявления.

Анализ данных проводится в неразрывной связи теоретического, качественного анализа сущности исследуемых явлений и соответствующего количественного инструментария изучения их структуры, связей и динамики.

Экономико-статистический анализ должен проводиться при строгом соблюдении следующих принципов, которые должны учитывать экономическую и статистическую их градацию.

К экономическим принципам необходимо отнести:

соответствие экономическим законам и положениям теории

расширенного воспроизводства;

адекватное отражение сущности экономической политики

современного этапа общественно-экономического развития;

ориентация на конечные экономические результаты;

учет специфики изучаемого объекта, отрасли и так далее;

согласование интересов субъектов различных иерархических

уровней как подразделений единого народно-хозяйственного

механизма.

К статистическим принципам следует отнести:

четко определенная цель экономико-статистического

исследования;

согласованность систем по горизонтали и вертикали;

сопоставимость во времени и пространстве;

логическая взаимосвязь между показателями,

характеризующими объект или явление;

комплексность и полнота отображения объекта исследования в

статистических показателях;

максимальная степень аналитичности.

Соблюдение данных принципов, наряду с предпосылками применения методологии статистического анализа, позволит осуществить научно-обоснованное экономико-статистическое исследование субъектов экономики в соответствии с принятой международной методологией учета и статистики.

7.2. Характеристика и принципы формирования  информационной базы

Статистическая информация представляет собой совокупность сведений социального и экономического характера, на основе которых осуществляются такие функции, как учет и контроль, планирование, статистический анализ и управление.

Источниками статистической информации в настоящее время являются органы государственной статистики, предприятия и организации, специализированные организации типа Института общественного мнения и так далее.

Информация, в первую очередь, должна быть подвергнута критической оценке, что является основным из этапов прогнозирования и обеспечивает объективность, достоверность и научную обоснованность заключений и выводов.

Под критической оценкой информационного материала следует понимать полноту, качество и достоверность его соответствия целям и задачам исследования.

Надежность выводов и заключений по анализу статистических данных обеспечивается минимизацией, в исходной информации, пробелов, неточностей, несопоставимости, неопределенности и так далее.

Качественная однородность, достоверность, объективность и точность информации, подвергаемой статистическому анализу может быть обеспечена, в первую очередь, надежностью схемы порядка сбора данных, которая должна реализовываться в следующей последовательности и содержать в себе полную и максимально точную характеристику:

источника информации;

программы сбора данных;

способа сбора данных;

содержания инструкции по проведению наблюдения;

контрольных мероприятий за качеством собираемого

материала в процессе наблюдения;

временного аспекта сбора данных;

степени репрезентативности данных (в случае несплошного

наблюдения).

Наряду с важностью соблюдения порядка собирания данных, существенным также является интуитивно-логический анализ, включающий в себя рассмотрение, в каждом конкретном случае, экономического содержания того или иного показателя, методологии и порядка его определения и так далее.

Только после того, как определено содержание статистического материала, охарактеризованы его позитивные и негативные стороны, можно приступать к статистическому анализу, который, в свою очередь, осуществляется посредством сравнений и сопоставлений.

Рынок предполагает, что некоторые аспекты экономики в целом, например, экономические кризисы, забастовки и так далее, не поддаются планированию. Их реакцию на развитие рынка нельзя предугадать. Возникает проблема неполноты информации.

В качестве причин возникновения проблемы неполноты информации, можно выделить следующие:

аномальные процессы в экономике;

многообразие форм собственности;

несоответствие современных форм статистической отчетности

условиям рыночной экономики;

разрыв договорных обязательств по предоставлению

статистической информации;

неточности, проистекающие из-за приблизительности методов

оценки данных: например, недостаточный объем выборки,

экспертные оценки;

технические ошибки.

Достичь соответствия количества и качества статистической информации требованиям данного этапа экономического развития, устранить ее дублирование, комплексно анализировать развитие экономики страны на основе применения макроэкономических, отраслевых и региональных статистических моделей, возможно лишь при соблюдении определенных требований к информационной базе:

Точность, полнота и представительность всех типов и групп.

Соответствие задачам проводимого исследования, то есть пригодность для реализации конкретных целей изучения, ограниченного во времени и пространстве объекта.

Одна и та же информация адекватна для решения одних задач и неадекватна для других.

Достоверность - степень соответствия статистической информации отображаемой ею действительности.

Оперативность информации.

Использование устаревшей информации о составе, структуре, основных характеристиках объекта, ведет к ошибочности исследования.

Чем больше период, отделяющий время применения данных о единицах генеральной совокупности от времени, на которое эти данные составлялись, тем меньше вероятность получить достоверную характеристику состояния изучаемого объекта.

Удобство работы с исходной информацией. Оно предполагает возможность быстро получить сведения о единицах генеральной совокупности, идентифицировать их, систематизировать.

Объектность.

Реальность исходной информации, так как она отражает различные стороны проявления процессов действительности, когда последние вовлекаются в сферу познания человека.

Систематичность сбора и обработки информации.

Научный подход к информации.

Масштабность и сложность подготовки, организации и проведения массовых наблюдений, требуют их научной организации на основе общенаучных методов познания действительности и общих положений статистики как науки.

Адекватность информации сущности и характеру изучаемых социально-экономических явлений.

Кроме статистической информации, статистик должен использовать другие виды информации, основными из которых являются:

бухгалтерская - сплошная, непрерывная регистрация наличия и движения всех материальных и финансовых средств организации;

оперативно-техническая - совокупность зарегистрированных отдельных событий и фактов непосредственно в момент их совершения. Отражает технологическое состояние объекта на тот или иной момент времени.

социологическая информация, для которой характерно сильное влияние субъективного фактора, необходимость учета классовых, групповых, социальных интересов, мотивов и так далее.

Характер и глубина изменений статистической информации обуславливаются реальными социально-экономическими процессами, развитием производительных сил общества и условиями рыночной экономики.

7.3.  Априорный анализ и его роль в статистическом моделировании

Оценка эффективности и деловой активности субъектов экономического процесса и состояния социальной инфраструктуры общества во многом зависит от качества статистического анализа эмпирического материала, от того, насколько точно будут выявлены и научно обоснованны закономерности и тенденции развития.

Основные трудности, связанные с применением количественных математико-статистических методов, заключаются в том, что они достаточно нейтральны к исследуемым социально-экономическим процессам.

Поэтому основным этапом проведения статистического исследования на информационной базе, характеризующей реальные социально-экономические явления, является критическая оценка исходных данных с точки зрения их достоверности и научной обоснованности, которая в статистическом моделировании реализуется методами априорного анализа, включающего в себя:

выявление экономически обоснованных и существенных причинно-следственных связей между признаками и явлениями;

оценку однородности исследуемой совокупности;

анализ характера распределения совокупности по изучаемым                признакам.

Понятия, используемые при проведении анализа статистическими методами, должны быть точно определены.

Необходимо четко определить, к какому моменту или периоду времени относится исследуемое явление или процесс.

Одной из основополагающих предпосылок проведения научно-обоснованного статистического анализа, адекватно отражающего причинно-следственные связи и зависимости, тенденции развития реальных явлений и процессов в динамике, является однородность статистической совокупности.

Анализ однородности статистической совокупности целесообразно проводить в следующей последовательности:

определение степени однородности всей совокупности по одному или нескольким существенным признакам;

определение и анализ аномальных наблюдений;

выбор оптимального варианта выделения однородных  совокупностей.

В статистической теории и практике разработаны различные подходы к оценке степени однородности. Проблемой оценки однородности совокупности занимались такие известные ученые, как Ю. Аболенцев, Г. Кильдишев, В. Овсиенко и др.

Наиболее сложным и дискуссионным является вопрос о способах и критериях выделения однородных групп объектов в пределах исходной совокупности.

Важной предпосылкой получения научно-обоснованных результатов статистического анализа и моделирования является проверка и выполнение гипотезы о близости распределения эмпирических данных нормальному закону. Для нормального закона распределения характерно:

; As = 0; Ex = 0

Одним из недостатков данного подхода к оценке характера распределения является наличие субъективности в анализе достаточности величины отклонения  от Me и Mo от Me для подтверждения гипотезы.

Любая исследуемая совокупность, наряду со значениями признаков, сложившихся под влиянием факторов, непосредственно характерных для анализируемой совокупности, может содержать и значения признаков, полученных под воздействием иных факторов, не характерных для основной совокупности.

Такие значения резко выделяются и, следовательно, использование методологии статистического моделирования без предварительного анализа и изучения аномальных наблюдений приводит к серьезным ошибкам при анализе. Резко выделяющиеся из общей совокупности наблюдения требуют их изучения.

Причины появления в совокупности аномальных наблюдений можно условно подразделить следующим образом:

внешние, возникающие в результате технических ошибок;

внутренние, объективно существующие.

Такие наблюдения представляют интерес для исследователя, так как могут содержать, за счет влияния особых неучтенных факторов, особую информацию.

На практике, в зависимости от условий места и времени, влияние одних факторов в каждый конкретный исследуемый момент или промежуток времени значительнее, чем других.

Выбор того или иного метода выявления и анализа аномальных наблюдений определяется объемом совокупности, характером исследуемых процессов и задач (одномерные и многомерные).

При реализации одномерных задач, как при анализе динамической, так и при анализе статической информации, наиболее широкое применение получил метод выявления аномальных наблюдений, основанный на определении q - статистики:

                                                                         (7.1)

где    yt  - отдельные уровни ряда;

- средний уровень ряда;

σy - среднеквадратическое отклонение значений ряда от их

     среднего уровня.

Если для расчетного значения выполняется неравенство:

qt ≥ qt кр (р)                                                                          (7.2)

с заранее заданными уровнями вероятности, то данное наблюдение считается аномальными и, после логико-экономического анализа причин ошибок аномальности, подлежит замене скорректированным значением (в случае ошибки "I") и не подлежат корректировке (в случае ошибки "II").

Корректировка осуществляется по схеме:

Рассчитывается новое значение уровня ряда:

.                                                      (7.3)

2.  заменяется в ряду на .

Определяются новые характеристики ряда с :  и.

Рассчитывается следующее значение:

          .                                                              (7.4)

Проверяется аномальность значения  :

    ,                                                                (7.5)

где ε - заданный уровень точности определения .

Если данное условие выполняется, то значение  является скорректированным, не аномальным значением, занимает место  в ряду и анализу подвергается .

Если условие не выполняется, то рекомендуется рассчитать  и проверить на аномальность.

Процесс корректировки носит итерационный характер.

В рядах динамики наибольшее распространение получил метод Ирвина, основанный на определении λ - статистики. При его использовании выявление аномальных наблюдений производится по схеме:

                            (7.6)

Если расчетное значение превысит уровень критического (с заданным уровнем точности и числом наблюдений) (таблица 1.1), то расчетное значение признается аномальным.

Схема реализации данного метода аналогична предыдущей с той лишь разницей, что  заменяется на yi-1  (предыдущее значение ряда).

Способ, основанный на расчете q - статистики применим для относительно стационарных рядов, так как при использовании для анализа динамических рядов, имеющих ярко выраженную тенденцию, он приведет к ошибкам.

Способ, основанный на расчете q - статистики применим для относительно стационарных рядов, так как при использовании для анализа динамических рядов, имеющих ярко выраженную тенденцию, он приведет к ошибкам.

Таблица 7.1

Табулированные значения λi. 

Число наблюдений

λкр

0,95

0,99

2

3

10

20

30

50

100

2,8

2,2

1,5

1,3

1,3

1,1

1,0

3,7

2,9

2,0

1,8

1,7

1,6

1,5

Более корректным является использование статистики, в которой определяются отклонения от теоретических значений, полученных по уравнению тренда :

                                                                        (7.7)

Нецелесообразность исключения аномальных явлений из изучаемой совокупности реализуется широким использованием метода группировок.

Важной задачей статистических исследований на этапе априорного анализа является выделение однородных групп (даже аномальных). В данном случае эффективно применять в анализе сложные комбинационные группировки с развернутым сказуемым.

Глава 8. Теоретические аспекты моделирования и прогнозирования бизнес-процессов

8.1. Система статистических понятий и категорий, применяемых в          моделировании и прогнозировании бизнес-процессов

Моделирование и прогнозирование явлений и процессов предполагает использование системы статистических понятий, категорий и методов, трактовка которых углубляется в соответствии с их статистическими особенностями.

К важнейшим понятиям и категориям относится статистическая совокупность, статистическая закономерность, закон больших чисел, статистическая взаимосвязь, а также такие философские категории как качество и количество, мера, явление и сущность, единичное и всеобщее, случайное и необходимое.

Важнейшими методами, используемыми при моделировании социально-экономических явлений, являются методы статистического наблюдения, группировок, обобщающих показателей, корреляционного и регрессионного анализа и так далее.

Статистическая закономерность выражает конкретные казуальные отношения, она предопределяет типичное распределение единиц статистической совокупности на некоторый момент времени под воздействием всей совокупности факторов.

Условиями ее проявления являются: наличие статистической совокупности и действие закона больших чисел.

Зная статистическую закономерность, можно выявить условия и причины, порождающие ее, для того, чтобы направлять ее действия в заданное "русло", то есть либо поддерживать эти условия для ее устойчивости во времени, либо, меняя их, стремиться получить нужный результат.

Зная статистическую закономерность, можно с той или иной степенью точности предсказать развитие явления, раскрыть сущность и изучить его структуру.

Под статистической совокупностью (множеством) понимается множество единиц, обладающих массовостью, однородностью, определенной целостностью, взаимозависимостью состояний отдельных единиц и наличием вариации.

Статистические совокупности состоят из элементов, единиц совокупности, которые являются носителем свойств изучаемого явления или процесса.

Признаки бывают существенные и несущественные, прямые и косвенные, атрибутивные и количественные, первичные и вторичные, факторные и результативные, альтернативные.

Классификация статистических признаков имеет важное значение для построения статистических моделей и осуществления прогноза. Так, при моделировании в ряде случаев важно правильно выделить факторные и результативные признаки. Среди факторных признаков необходимо отбирать лишь самые существенные, определяющие основное содержание явлений.

Закон больших чисел выявляет устойчивые пропорции и соотношения в экономических явлениях и процессах. Он служит основой для моделирования процессов, создает возможность управлять ими и предвидеть их развитие.

Закон больших чисел определяет общее, существенное в явлениях, в их массе единиц, благодаря чему происходит взаимоотношение индивидуальных случайных различий.

Итак, моделирование - воспроизведение свойств исследуемого объекта в специально построенной модели. Для этой цели используются такие статистические методы как статистическое наблюдение, метод группировок, обобщающих показателей, корреляционный и регрессионный анализ.

С помощью статистического наблюдения и социального эксперимента получают исходную информацию для моделирования и прогнозирования.

Метод группировок устанавливает наличие и направление связи  между факторными и результативными признаками. Для объективных заключений о связи необходимо предварительно определить границу, за пределами которой влияние группировочного признака отсутствует.

На основе регрессионного и корреляционного анализа связи получают свое аналитическое выражение, устанавливается теснота связей между факторными и результативными признаками.

Значимость корреляционных характеристик определяется объективными особенностями исследуемой совокупности, а показатели регрессии и корреляции вычисляются как средние величины для совокупности в целом.

8.2. Модель как отображение действительности

Наши представления об окружающей действительности по природе своей являются приближенными копиями объективной реальности.

Термин "модель" отражает как раз эту условность, приблизительность знания об объективной действительности.

Что же такое модель?

В "Философском словаре" дается следующее определение: "Моделирование - воспроизведение свойств исследуемого объекта на специально построенном по определенным правилам аналоге его. Этот аналог называется моделью".

В "Философской энциклопедии" говорится: "Модель - условный образ (изображение, схема, описание) какого-либо объекта (или системы объектов) служит для выражения отношения между человеческими знаниями об объектах и этими объектами".

Таким образом, под моделью понимается условный образ какого-либо объекта, приближенно воссоздающий этот объект. Между объектом и его моделью существуют отношения сходства, условности.

Модель дает возможность установить в каждом явлении, объекте, процессе те основные, главные закономерности, которые присущи этим явлениям.

Отношения объекта и модели устанавливаются на основе объективно присущих оригиналу и модели свойств и отношений.

Прежде всего между моделью и объектом существует отношение соответствии (сходства), которое и позволяет исследовать моделируемый объект посредством изучения модели.

Но модель используется и для получения таких данных об объекте, которые или затруднительно, или невозможно получить путем непосредственного изучения оригинала. Для того, чтобы модель могла выполнить эту задачу, она должна быть не только сходной с оригиналом, но и отличаться от него. Отличие от оригинала - обязательный признак модели.

В процессе моделирования от установления отношений сходства между одними элементами модели и оригинала переходим к установлению отношений сходства между другими элементами оригинала и модели. Именно наличие такого перехода дает возможность получить новые данные об оригинале, о его свойствах, связях и отношениях.

Возможны два направления в моделировании.

Одно из направлений охватывает множество задач, в которых основное внимание уделено отысканию оптимальных характеристик процесса.

В качестве таких моделей часто выступают модели линейного программирования. Эти модели часто называют экономико-математическими, поскольку их применение связано главным образом с моделированием функциональных зависимостей.

Сущность статистического моделирования состоит в построении для данного явления модели, на основании которой изучается поведение элементов системы и взаимодействие между ними с учетом многих, имеющих случайный характер, факторов. Данное направление включает в себя корреляционный анализ, изучение законов распределения и другие.

Модели, выражающие количественно закономерность, которая проявляется в массе событий, называют экономико-статистическими моделями.

Повышенный интерес, проявляемый в последние годы к статистическим моделям, обусловлен наличием электронно-вычислительных машин, позволяющих обрабатывать большие массивы информации.

Статистические модели можно подразделить на два типа: статистические и временные. В первом случае речь идет об исследовании статистической совокупности. Единицей наблюдения здесь служат отдельные единицы пространственной совокупности, а в качестве статистической информации используются их показатели по состоянию на определенный период времени.

Временная модель рассматривает процесс изменения явления во времени. В качестве единицы наблюдения здесь выступает время, а исходной информацией служат ряды динамики явления и определяющие его факторы.

По своим познавательным функциям статистические модели подразделяются на структурные, динамические и модели взаимосвязей.

8.3. Сущность и классификация статистических прогнозов

Статистическое прогнозирование, наряду с другими видами прогнозирования социально-экономических явлений и процессов, является инструментом социально-экономического управления и развития.

Прогнозирование – это вид познавательной деятельности человека, направленной на формирование прогнозов развития объектов, на основе анализа тенденций и закономерностей его развития.

Прогнозирование – это научное, основанное на системе установленных причинно-следственных связей и закономерностей, выявление состояния и вероятностных путей развития явлений и процессов.

Прогнозирование предопределяет оценку показателей и дает характеристику явлений и процессов в будущем. Прогнозирование распространяется на такие процессы управления, которые в момент выработки прогнозов можно определить в весьма малом диапазоне, либо совсем невозможно, либо возможно, но требует учета действия таких факторов, влияние которых не может быть полностью или однозначно определено.

В зависимости от степени конкретности и характера воздействия на ход исследуемых процессов и явлений можно выделить три основные понятия прогнозирования:

гипотеза;

предсказание;

прогноз.

Данные понятия тесно взаимосвязаны в своих проявлениях друг с другом и с исследуемым объектом и представляют собой последовательные ступени познания поведения явления и объекта в будущем.

Гипотеза – это научно обоснованное предположение либо о непосредственно ненаблюдаемом факте, либо о закономерном порядке, объясняющем известную совокупность явлений.

На уровне гипотезы дается качественная характеристика объекта, выражающая общие закономерности его поведения.

Гипотезой является не всякая догадка, а лишь предположение, которое носит вероятный характер. Установив, что группа явлений, закономерная связь которых неизвестна, имеет ряд тождественных черт с другой группой явлений, закономерная связь которых уже установлена, делается вывод о вероятности частичного сходства искомой закономерной связи с уже определенной.

Развиваясь, гипотеза одновременно подвергается проверке, необходимость которой вытекает из самой сущности гипотезы как предположения.

Проверка гипотезы состоит в том, что все следствия, полученные посредством теоретического анализа основного допущения гипотезы сопоставляются с эмпирическими данными.

Если по одной и той же задаче, проблеме и так далее возникает одновременно несколько гипотез и известно, какие гипотезы здесь вообще возможны, а какие – нет, то доказательством истинности одной из рассматриваемых гипотез является установление ложности всех остальных.

Степень вероятности гипотезы тем выше, чем разнообразнее и многочисленнее ее следствия, подтвержденные эмпирическим путем.

Достаточность условий реализации гипотез, их вероятность теоретически и практически граничит с высокой степенью достоверности. Гипотеза оказывает воздействие на процесс через прогноз, являясь важным источником информации для его составления.

Предсказание – это предвидение таких событий, количественная характеристика которых невозможна или затруднена.

Прогноз – это количественное, вероятностное утверждение в будущем о состоянии объекта или явления с относительно высокой степенью достоверности, на основе анализа тенденций и закономерностей прошлого и настоящего.

Прогноз в сравнении с гипотезой имеет большую определенность и достоверность, так как основывается как на качественных так и на количественных характеристиках. В отдельных случаях прогноз может носить качественный характер, но в его основе всегда лежат количественные явления.

Для осуществления прогноза, то есть определения понятий, как будет осуществляться и развиваться прогнозируемые явления в будущем, необходимо знать тенденции и закономерности прошлого и настоящего. При этом, следует помнить, что будущее зависит от многих случайных факторов, сложное переплетение и сочетание которых учесть практически невозможно. Следовательно, все прогнозы носят вероятностный характер.

 Прогнозы можно подразделить в зависимости от целей, задач, объектов, времени упреждения, источников информации и так далее.

В зависимости от целей исследования  прогнозы делятся на поисковые и нормативные.

Нормативный прогноз – это прогноз, который предназначен для указания возможных путей и сроков достижения заданного, желаемого конечного состояния прогнозируемого объекта, то есть нормативный прогноз разрабатывается на базе заранее определенных целей и задач.

Поисковый прогноз не ориентируется на заданную цель, а рассматривает возможные направления будущего развития прогнозируемого объекта, то есть выявление того, как будет развиваться объект в будущем полностью зависит от сохранения существующих тенденций.

В зависимости от специфики области применения прогноза и от объекта прогнозирования прогнозы подразделяются на:

естественноведческие – это прогнозы в области биологии, медицины и т.д;

научно-технические – это, например, инженерное прогнозирование технических характеристик узлов, деталей и т.д.;

В зависимости от масштабности объекта, прогнозы бывают:

глобальные – рассматривают наиболее общие тенденции и закономерности в мировом масштабе;

макроэкономические – анализируют наиболее общие тенденции явлений и процессов в масштабе экономики страны в целом;

структурные (межотраслевые и межрегиональные) – предсказывают развитие экономики в разрезе отраслей;

региональные – предсказывают развитие отдельных регионов;

отраслевые – прогнозируют развитие отраслей;

микроэкономические – предсказывают развитие отдельных предприятий, производств и так далее.

По сложности прогнозы различают:

сверхпростые – прогноз на основе одномерных временных рядов, когда отсутствуют связи между признаками;

простые – прогнозы, предполагающие учет оценки связей между факторными признаками;

сложные – прогнозы, оценка связей между признаками в которых определяется на основе системы уравнений или многофакторного динамического прогнозирования.

По времени упреждения выделяются следующие прогнозы социально-экономических явлений и процессов:

текущие – до 1 года;

краткосрочные – 1 – 3 года;

  среднесрочные – 3 – 5 лет;

  долгосрочные – 5 – 10 лет;

  дальнесрочные – 10 и более лет.

Период упреждения прогноза – это отрезок времени от момента, для которого имеются последние статистические данные об изучаемом объекте, до момента, к которому относится прогноз.

Период упреждения прогноза зависит от специфики и особенностей изучаемого объекта исследования, от интенсивности изменения показателей, от продолжительности действия выявленных тенденций и закономерностей, от длины временного ряда и от многих других факторов.

Перечисленные виды прогнозов по времени упреждения отличаются друг от друга по своему содержанию и характеру оценок исследуемых процессов.

Текущий прогноз основан на предположении о том, что в прогнозируемом периоде не произойдет существенных изменений в исследуемом объекте, а если и произойдут, то количественно несущественные.

Краткосрочный и среднесрочные прогнозы предполагают, что произойдут существенные изменения с изучаемым объектом как в количественных, так и в качественных характеристиках. При этом в краткосрочном и среднесрочном прогнозах оценка явлений и процессов дается в разрезе количественно-качественном, а в долгосрочном и дальнесрочном прогнозах – качественно-количественном.

Выбор методов прогнозирования осуществляется в соответствии с характером объекта, требований, предъявляемых к информационному обеспечению, а также на основе сравнения эффективности и оптимальности решения аналогичных задач.

 Отличительной чертой социально-экономических явлений и процессов является инерционность, проявляющаяся, с одной стороны в сохранении взаимосвязей прогнозируемого явления с другими явлениями, а с другой – в сохранении тенденции во времени.

Для обеспечения научной обоснованности и достоверности социально-экономических прогнозов необходимо, чтобы в ходе их составления раскрывались и познавались причинно-следственные связи и факторы, характеризующие развитие процессов и явлений, изучались их внутренние структурные связи, а также внешняя среда, в которой они проявляются.

8.4. Этапы построения статистических прогнозов

Основными этапами разработки статистических прогнозов являются:

Анализ объекта прогнозирования. На этом этапе рассматривается состояние, основные элементы, взаимосвязи и факторы, формирующие и оказывающие влияние на исследуемых объект; выдвигается основная рабочая гипотеза; выявляются причинно-следственные связи как внутри явления, так и вне его и определяется их статистическое выражение.

Характеристика информационной базы исследования.

На данном этапе выдвигаются основные требования, предъявляемые к информационной базе. При этом различают количественную информацию, обработку которой осуществляют статистическими методами, и качественную информацию, сбор и обработка которой производится преимущественно эвристическими и непараметрическими статистическими методами анализа.

Выбор метода прогнозирования.

Процесс выбора метода прогнозирования обусловлен объективизацией прогноза, которая обеспечивает реализацию наиболее точного и достоверного прогноза. С этой целью целесообразно использовать различную исходную информацию и несколько методов прогнозирования.

Построение исходной модели прогноза и ее реализация. Данный этап предполагает, что основой построения прогноза является разработка достаточно адекватной исходной модели, обладающей прогностическими свойствами.

Проверка достоверности, точности и обоснованности прогноза.

На данном этапе дается достоверная оценка процесса прогнозирования  на основе расчета и анализа абсолютных, относительных и средних показателей точности прогноза. Надежность прогноза определяется, как правило, величиной доверительных интервалов.

Принятие решений на основе прогнозной модели и выработка рекомендаций о возможностях ее использования для получения прогнозных оценок.

Построение достаточно точных и надежных прогнозов позволяет на практике наиболее четко сформулировать резервы и пути развития изучаемых социально-экономических явлений и процессов.

Одним из наиболее распространенных методов прогнозирования социально-экономических явлений и процессов является экстраполяция,  то есть продление тенденции и закономерностей, связей и соотношений прошлого и настоящего на будущее.

Типичным и наиболее применимым примером экстраполяции является прогнозы по одномерному временному ряду, который заключается в продлении на будущий период сложившейся тенденции изучаемого явления. Основная цель данного прогноза  заключается в том, чтобы показать, к каким результатам можно прийти в будущем, если развитие явления будет происходить со скоростью, ускорением и так далее, аналогичным прошлого периода. Если прогнозная оценка окажется неудовлетворительной, то сложившаяся в прошлом тенденция должна быть изменена с учётом тех факторов, под влиянием которых она складывается.

Широкое практическое применение методов экстраполяции  трендов объясняется простотой метода, сравнительно небольшим объемом информации и четкостью механизма реализации, лежащих в его основе предпосылок.

Теоретической основой распространения тенденции на будущее является свойство социально-экономических явлений, называемое инерционностью.

Инерционность – это сохранение тенденций, закономерностей, скорости и характера развития явлений и процессов в будущем, измеренных по данным прошлого периода.

Статистическое прогнозирование предполагает не только качественное предсказание, но и достаточно точное количественное измерение вероятных возможностей, ожидаемых значений признака. Для данной цели важно, чтобы прогностическая модель имела достаточную точность или допустимо малую ошибку прогноза.

Ошибка статистического прогноза будет тем меньше, чем меньше срок упреждения и чем длиннее информационная база прогноза. Оба этих фактора ошибки прогноза имеют следующие условия: состояние и параметры процесса в ближайшем будущем более сходны с фактическими данными и поэтому их предвидеть можно точнее, чем параметры того же процесса в далеком будущем.

Если тенденция динамики сохранялась неизменной 30 лет, есть гораздо большая вероятность ее сохранения и в последующие пять лет, чем если существующая тенденция возникла всего десять лет назад.

Однако из этих условий нельзя однозначно вывести какой-либо универсальный алгоритм определения допустимого срока упреждения при заданной точности прогноза либо наоборот. Приходится на данном этапе ограничиться чисто эмпирическим правилом: в большинстве случаев срок упреждения не должен превышать третей части длины базы прогноза. Иначе говоря, для прогноза на 5 уровней желательно иметь временной ряд для прогноза по длине не менее чем  15 уровней.

В каждом конкретном исследовании  соотношение длины базы прогноза и срока упреждения необходимо обосновать, кроме учета вышеперечисленных общих правил, используя еще и всю возможную информацию об особенностях изучаемого объекта.

Прогнозы на основе экстраполяции временных рядов, как и любые статистические прогнозы, могут быть либо точечными либо интервальными.

Экстраполяцию в общем виде можно представить формулой вида:

                                                            (8.1)

где  yi - текущий уровень исходного временного ряда;

L - период упреждения;

ai - параметр уравнения тренда

В зависимости от того, какие принципы и исходные данные положены в основу прогноза, можно выделить следующие группы методов прогнозирования социально-экономических явлений:

прогнозирование на основе простейших методов;

прогнозирование на основе экстраполяции трендов;

прогнозирование на основе дисконтирования информации;

прогнозирование на основе кривых роста.

Данные группы методов прогнозирования наиболее подробно будут рассмотрены в следующих параграфах.

Глава 9. Методологические аспекты оценки скорости и интенсивности изменения бизнес-процессов

9.1. Понятие о рядах динамики и их виды

Выявление и отображение процесса развития и изменения социально-экономических явлений во времени – одна из основных задач статистики. Для ее решения в статистике строятся особые ряды статистических показателей, которые называются рядами динамики (иногда их называют временными рядами), то есть – это ряды изменяющихся во времени значений статистического показателя, расположенных в хронологическом порядке.

Ряд динамики состоит из двух элементов: показателей уровня ряда и показателей времени (годы, кварталы, месяцы, сутки) или моментов времени.

Уровни ряда обычно обозначаются через «y», моменты или периоды времени, к которым  они относятся - через «t».

Ряды динамики, как правило, представляют в виде таблицы или графически.

Ряды динамики могут быть классифицированы по следующим признакам:

В зависимости от способа выражения уровней ряды динамики подразделяются на ряды абсолютных, относительных и средних величин. При этом ряды динамики абсолютных величин рассматриваются как исходные, а ряды относительных и средних величин как производные.

Ряды динамики абсолютных величин более полно характеризуют развитие процесса или явления, например: объема валового внутреннего продукта в целом, грузооборота транспорта, инвестиций в основной капитал, производства продукции животноводства и т.д.

Ряды относительных величин могут характеризовать во времени темпы роста (или снижения) определенного показателя; изменение удельного веса того или иного показателя в совокупности; изменение показателей интенсивности отдельных явлений, например, удельный вес приватизированных предприятий в той или иной отрасли; производство продукции на душу населения; структура инвестиций в основной капитал по отраслям экономики и др.

Ряды динамики средних величин служат для характеристики изменения уровня явления, отнесенного к единице совокупности, например: данные о среднегодовой численности занятых в экономике; о средней урожайности отдельных сельскохозяйственных культур, о средней заработной плате  в отдельных отраслях и т.д.

В зависимости от характера отображения времени ряды динамики делятся на моментные и интервальные.

Уровни моментных рядов динамики характеризуют явления по состоянию на определенный момент времени.

Уровни моментного ряда динамики абсолютных величин не меняется с изменением временного промежутка, т.е. их нельзя суммировать в классическом смысле этого слова.

Уровни интервальных рядов динамики характеризуют явления за определенный промежуток, интервал времени.

Если уровни интервального ряда представляют собой абсолютные величины, то их можно суммировать во времени, т.е. переходить от ряда динамики с малыми временными интервалами к более крупным промежуткам времени. Суммируя уровни интервальных рядов из абсолютных величин, можно строить ряды динамики с нарастающими итогами.

В зависимости от расстояния между уровнями, ряды динамики подразделяются на ряды с равноотстоящими уровнями и неравноотстоящими уровнями во времени. Ряды динамики следующих друг за другом периодов или следующих через определенные промежутки дат называется равноотстоящими. Если же в рядах даются прерывающиеся периоды или неравномерные промежутки между датами, то ряды называются неравноотстоящими.

9.2. Сопоставимость уровней и смыкание рядов динамики

Важнейшим условием правильного построения ряда динамики являются сопоставимость всех входящих в него уровней. Данное условие решается либо в процессе сбора и обработки данных, либо путем их пересчета.

Проблема сопоставимости данных особенно остро стоит в рядах динамики, потому что они  могут охватывать значительные периоды времени, за которые могли произойти изменения, приводящие к несопоставимости статистических рядов. Рассмотрим основные причины несопоставимости уровней ряда динамики.

Несопоставимость уровней ряда может возникнуть вследствие изменения единиц измерения и единиц счета. Нельзя сравнивать и анализировать цифры о производстве тканей, если за одни годы оно дано в погонных метрах, а за другие – в квадратных метрах.

На сопоставимость уровней ряда динамики непосредственно влияет методология учета или расчета показателей. Например, если в они годы среднюю урожайность считали с засеянной площади, а в другие – с убранной, то такие уровни будут несопоставимы.

В процессе развития во времени, прежде всего, происходят количественные изменения явлений, а затем на определенных ступенях совершаются качественные скачки, приводящие к изменению закономерностей явления. Поэтому научный подход к изучению рядов динамики заключаются в том, чтобы ряды, охватывающие большие периоды времени, расчленять на такие, которые бы объединяли лишь однокачественные периоды развития совокупности, характеризующейся одной закономерностью развития.

Процесс выделения однородных этапов развития рядов динамики носит название периодизации динамики. Вопрос о том, какие этапы развития прошло то или иное явление за определенный исторический отрезок времени, решается теорией той науки, к области которой относится изучаемая совокупность явлений.

Важно также, чтобы в ряду динамики интервалы или моменты, по которым определены уровни, имели одинаковый экономический смысл. Уровни ряда динамики могут оказаться несопоставимыми по кругу охватываемых объектов вследствие перехода ряда объектов из одного подчинения в другое.

Несопоставимость уровней ряда может возникнуть вследствие изменений территориальных границ областей, районов и так далее.

Следовательно, прежде чем анализировать динамический ряд, надо, исходя из цели исследования, убедится в сопоставимости уровней ряда и, если последняя присутствует, добиться ее дополнительными расчетами. Для того, чтобы привести уровни ряда динамики к сопоставимому виду, иногда приходится прибегать к приему, который носит название смыкания рядов динамики. Под смыканием понимают объединение в один ряд (более длинный) двух или нескольких рядов динамики, уровни которых исчислены по разной методологии или в разных территориальных границах. Для  осуществления смыкания необходимо, чтобы для одного из периодов (переходного) имелись данные, исчисленные по разной методологии (или  в разных границах).

Другой способ смыкания рядов динамики заключается в том, что уровни года, в котором произошли изменения, как до изменений, так и после изменений принимаются за 100%, а остальные пересчитываются в процентах по отношению к этим уровням соответственно.

Та же проблема приведения к сопоставимому виду возникает и при параллельном анализе развития во времени экономических показателей отдельных стран, административных и территориальных районов. Это, во-первых, вопрос о сопоставимости цен сравниваемых стран, во-вторых, вопрос о сопоставимости методики расчета сравниваемых показателей. В таких случаях ряды динамики приводятся к одному основанию, то есть к общей базе сравнения, принятой за единицу или 100%. В зависимости от цели анализа в качестве общей базы (основания) каждого ряда могут быть приняты: а) начальный уровень; б) какой-либо другой характерный уровень; в) средний уровень за тот или иной период  (в том числе за весь изучаемый период).

Если уровни сравниваемых рядов систематически растут (или снижаются), за базу сравнения целесообразно принять начальный уровень. Если же уровни то повышаются, то понижаются, базу сравнения необходимо расширить, приняв за нее средний уровень. Это сделает базу сравнения более характерной, типичной и устойчивой. В частности, при отсутствии явной тенденции к росту или снижению, а также при волнообразных, периодических колебаниях уровней в качестве общей базы сравнения целесообразно применять средний уровень за весь период.

Несопоставимость уровней сравниваемых рядов таким образом нивелируется, и их можно сравнить. Темпы развития целесообразно сравнивать только путем деления большего из них на меньший. При этом оба сравниваемых темпа роста должны характеризовать одинаковый по направлению процесс, то есть либо рост, либо снижение уровня динамического ряда.

Коэффициент, показывающий во сколько раз один базисный (конечный) темп роста больше другого, называется коэффициентом опережения по темпам роста (или прироста) или коэффициентом относительного опережения (Ко):

  (ТАБ),                                               (9.1)

где Тр(А) – конечный базисный темп роста явления А;

      Тр(Б) – конечный базисный темп роста явления Б.

Если для сравнения темпы прироста или среднегодовые темпы роста или прироста, в формуле (3.1) вместо Тр берутся соответственно Тпр,  или . При сравнении среднегодовых темпов коэффициент относительного опережения также будет среднегодовым.

9.3. Аналитические показатели ряда динамики

Анализ скорости и интенсивности развития явления во времени осуществляется с помощью аналитических показателей, которые получаются в результате сравнения уровней ряда между собой. К таким показателям относятся: абсолютный прирост, темп роста и прироста, абсолютное значение одного процента прироста. При этом принято сравниваемый уровень называть отчетным, а уровень, с которым происходит сравнение - базисным.

Абсолютный прирост (Dу) характеризует размер увеличения (или уменьшения) уровня ряда за определенный промежуток времени. Он равен разности двух сравниваемых уровней и выражает абсолютную скорость роста:

Di = уi-yi-k  (i=1,2,3,...,n)       (9.2)

Если k=1, то уровень yi-1  является предыдущим для данного уровня, а абсолютные приросты изменения уровня будут цепными. Если же k постоянны для данного ряда, то абсолютные приросты будут базисными.

Интенсивность изменения уровня оценивается отношением отчетного уровня к базисному, которое всегда представляет собой положительное число.

Показатель интенсивности изменения уровня ряда - в зависимости от того, выражается ли он в виде коэффициента или в процентах, принято называть коэффициентом роста или темпом роста. Иными словами, коэффициент роста и темп роста представляют собой две формы выражения интенсивности изменения уровня. Однако необходимо отметить, что ненужно пользоваться одновременно двумя формами, которые по существу идентичны. Разница между ними заключается только в единице измерения.

Коэффициент роста показывает во сколько раз данный уровень ряда больше базисного уровня (если этот коэффициент больше единицы) или какую часть базисного уровня составляет уровень текущего периода за некоторый промежуток времени (если он меньше единицы). В качестве базисного уровня в зависимости от цели исследования может приниматься какой-то постоянный для всех уровень (часто начальный  уровень ряда), либо для каждого последующего предшествующий ему:

   (9.3)

В первом случае говорят о базисных темпах роста, во втором - о цепных темпах роста.

Наряду с темпом роста можно рассчитать показатель темпа прироста, характеризующий относительную скорость изменения уровня ряда в единицу времени. Темп прироста показывает, на какую долю (или процент) уровень данного периода или момента времени больше (или меньше) базисного уровня.

Темп прироста есть отношение абсолютного прироста к уровню ряда, принятого за базу:

 (9.4)

Если темп роста всегда положительное число, то темп прироста может быть положительным, отрицательным и равным нулю.

В статистической практике часто вместо расчета и анализа темпов роста и прироста вычисляют абсолютное значение одного процента прироста. Оно представляет собой одну сотую часть базисного уровня и в то же время - отношение абсолютного прироста к соответствующему темпу прироста:

   (9.5)

где |%| - обозначение абсолютного значения одного процента прироста.

Таким образом, базисные показатели динамики характеризуют окончательный результат всех изменений в уровнях ряда от периода, к которому относится базисный уровень, до данного (i-го) периода. Цепные показатели динамики характеризуют интенсивность изменения уровня от периода к периоду (или от даты к дате) в пределах изучаемого промежутка времени (схема 9.1).

Рис. 9.1. Построение цепных и базисных аналитических показателей динамики.

9.4. Средние показатели рядов динамики

Каждый ряд динамики можно рассматривать как некую совокупность m меняющихся во времени показателей, которые можно обобщать в виде средних величин. Для обобщения данных по рядам динамики рассчитываются: средний уровень ряда; средний абсолютный прирост; средний темп роста и прироста.

Средний уровень ряда динамики () рассчитывается по средней хронологической. Средней хронологической называется средняя, исчисленная из значений, изменяющихся во времени. Такие средние обобщают хронологическую вариацию. В хронологической средней отражается совокупность тех условий, в которых развивалось изучаемое явление в данном промежутке времени.

Для разных видов рядов динамики средний уровень рассчитывается неодинаково.

Для интервальных равноотстоящих рядов средний уровень находится по формуле простой средней арифметической.

Для интервальных неравноотстоящих рядов средний уровень находится по формуле взвешенной средней арифметической.

где     уi - уровень ряда динамики;

n - число уровней;

ti - длительность интервала времени между уровнями.

Средний уровень моментного равноотстоящего ряда динамики находится по формуле средней хронологической простой:

   (9.8)

Средний уровень моментных рядов динамики с неравноотстоящими уровнями определяются по формуле средней хронологической взвешенной:

(9.9)

где  yi, yn - уровни рядов динамики;

 ti - длительность интервала времени между уровнями.

Обобщающим показателем скорости изменения явления во времени является средний абсолютный прирост за весь период, ограничивающий ряд динамики. Для его определения можно воспользоваться формулой средней арифметической простой:

               (9.10.)

или

    (9.11)

Сводной обобщающей характеристикой интенсивности изменения уровней ряда динамики служит средний темп роста, показывающий, во сколько раз в среднем за единицу времени изменился уровень динамического ряда.

Необходимость  исчисления  среднего  темпа  роста  возникает  вследствие того,  что  темпы  роста  из  года  в  год  колеблются.  Кроме того,  средний  темп роста  часто  нужно определять в тех случаях, когда имеются данные об уровне в начале какого-либо периода и в конце его, а промежуточные данные отсутствуют.

Средний темп (коэффициент) роста рассчитывается по формуле средней геометрической из цепных коэффициентов роста:

 

Поскольку всякий темп роста является отношением уровней ряда динамики, так, что  в формуле средней геометрической темпы роста заменяются соответствующим отношением уровней. Заменив темпы роста выражающими их отношениями и учитывая, что эти величины перемножаются, найдем подкоренное выражение как:

Следовательно, средний темп роста может быть выражен формулой:

                                      (9.13)

Когда приходится вести расчет средних темпов роста по периодам различной продолжительности (разноотстоящие ряды динамики), то пользуются средними геометрическими, взвешенными по продолжительности периодов. Формула средней геометрической взвешенной будет иметь вид:

    (9.14)

где    t - интервал времени, в течении которого сохраняется данный темп роста;

S - сумма отрезков времени периода.

Средний темп прироста не может быть определен непосредственно на основании последовательных темпов прироста или показателей среднего абсолютного прироста. Для его вычисления необходимо вначале найти средний темп роста, а затем уменьшить его на единицу или 100%:

                                                      (9.15)

Глава 10. Моделирование основных тенденций и закономерностей бизнес-процессов

10.1. Особенности статистического анализа одномерных временных рядов по компонентам

Основной задачей, решаемой при проведении любого статистического исследования, является определение объективных закономерностей развития социально-экономических явлений и процессов на основе анализа динамической информации.

Статистические модели, построенные на основе временных рядов социально-экономических показателей, позволяют применять математико-статистические методы для описания закономерностей развития объектов экономики  как в прошлом, так и в будущем.

Используемые для целей и задач прогнозирования временные ряды экономических показателей обладают целым рядом особенностей.

Временной ряд есть последовательность, в которой каждое значение содержит в себе прошлое для последующих состояний. Любая попытка предвидеть будущее без  исследования динамических рядов прошлого является малообоснованной, ненаучной и ошибочной. Поэтому для получения достаточно точных и надежных прогнозов, необходимо подробно изучить настоящее состояние явления или процесса.

Всю процедуру статистического анализа одномерных временных рядов целесообразно разделить на пять стадий, которые представлены на схеме 10.1.

Исследование скорости и интенсивности развития временных рядов часто не позволяет сразу определить основную тенденцию поступательного движения изучаемого явления.

Это зависит от того, что уровни временного ряда со временем меняются, колеблются, но эта колеблемость не одинакова и может быть вызвана следующими причинами:

влиянием общих факторов, определяющих главное направление, основную тенденцию развития явления;

влиянием факторов общего характера, действующих периодически, сезонных колебаний и т.д.;

влиянием специфических факторов, каждый из которых действует в разных направлениях, и их действие несущественно с точки зрения результатов развития                     явления, случайных колебаний.

Рис. 10.1. Схема статистического анализа одномерных временных рядов

Тип связи между компонентами временного ряда можно определить по нормальному распределению отклонений эмпирических значений уровней временного ряда от теоретических, полученных по уравнению тренда.

В случае нормальности распределения абсолютных отклонений связь является аддитивной, а относительных — мультипликативной.

Основные компоненты могут воздействовать на величину уровней временного ряда по-разному:

если факторы, образующие эти компоненты, мультипликативные, то значения уровней временных рядов являются произведением этих компонентов:  

                      ;                        (10.1)

если факторы аддитивные, то значения уровней временных рядов являются суммой компонентов:

                                                ;                              (10.2)

если факторы временного ряда выражены комбинированно, то значения уровней являются или произведением, или суммой компонентов:

                         ,                                                     (10.3)

где    T — тенденция;

С — сезонный компонент;

e — случайный компонент.

Все компоненты временного ряда взаимосвязаны между собой и являются теоретическими понятиями. С этой точки зрения разделение временных рядов на компоненты - это теоретическая абстракция, так как данное разделение является чисто математической процедурой и осуществляется на базе статистических методов. Но, не смотря на условность  такого расчленения фактических уровней рядов, такой прием может оказаться довольно полезным для решения разных проблем анализа и прогнозирования на базе временных рядов.

По поводу расчленения временных рядов на компоненты известный русский ученый Четвериков Н. С. отмечал, что «расчленению подвергается динамика, а не само явление, участвующее не раздельно во всем сложном движении».

Тип связи между компонентами можно также определить по динамике отклонений эмпирических значений уровней временного ряда от теоретических, полученных по уравнению тренда. Если абсолютные отклонения имеют тенденцию к росту, а относительные варьируют приблизительно на одинаковом уровне, то это свидетельствует о мультипликативной связи тренда и сезонного компонента.

На практике выделить компоненты сложно, так как отдельные последующие значения временных рядов зависят от предыдущих. Поэтому неверно допускать, что факторы, влияющие на колебания уровней, независимы. Кроме того, статистическая совокупность, изучаемая в течение длительного периода, перестает быть такой же самой совокупностью, так как могут измениться основные факторы, влияющие на ее формирование.

На первой стадии анализа для разложения рядов на составные компоненты и устранения влияния систематических компонент на изменение случайного компонента можно применить различные методы определения и установления отдельных неслучайных компонент временных рядов. В частности, при выявлении основной тенденции может быть использована схема анализа, представленная на рис. 10.2.

Согласно данной схеме, прежде чем перейти к выделению основной тенденции развития явления, следует проверить гипотезу о том, существует ли она вообще. Отсутствие тенденции означает неизменность среднего уровня ряда во времени.

Рис. 10.2.  Схема статистического анализа основной тенденции во временных рядах.

Экономическим явлениям свойственны элементы вероятностного характера. Наличие случайного  в социально-экономических явлениях объясняется сложным переплетением параметров экономической системы, влиянием на них большого числа взаимосвязанных факторов, действующих в разных направлениях. Это ведет к вариации показателей уровней временного ряда.

Ввиду концепции о наличии вероятностных элементов  в динамике процессов, уровни временного ряда могут рассматриваться как сумма детерминированного и случайного компонентов.

Детерминированный компонент выражается некоторой функцией и определяется уравнением основной тенденции или тренда.

Проявление случайного компонента оценивается с некоторой вероятностью.

Отклонения фактических уровней временного ряда от тренда рассматривается как стационарный случайный процесс.

Выявление основной тенденции развития — это один из методов анализа и обобщения временных рядов. Он позволяет выразить особенности изменения явления во времени.

Поэтому следует различать понятия:

основная тенденция;

тренд;

закон развития явления.

Тренд — некоторая аналитическая функция, которая связывает единым ‘‘законом движения’’ все последовательные уровни временного ряда. Тренд описывает общую тенденцию на базе лишь одного фактора – фактора времени ( t ). Следовательно не полностью описывает характер тенденции развития и не может рассматриваться как закон развития явления.

Закон развития явления — выражает сущность, природу явления, не поддающуюся описанием тренда.

При изучении временных рядов возникают следующие проблемы:

временной ряд — это числовые последовательности образования уровней во времени (только в одном направлении);

временной ряд экономических показателей как правило содержит долговременную или краткосрочную тенденции развития, связанные с преодолением случайных колебаний;

временные ряды могут быть подвержены регулярным колебаниям, связанным с сезонностью, ритмичностью и другими периодическими колебаниями;

во временных рядах может наблюдаться связь следующих с предыдущими уровнями, то есть автокорреляция;

при анализе развития взаимосвязанных временных рядов может возникнуть отставание одних рядов от других, выражаемое на основе временного шага;

развитие социально-экономических явлений происходит

непрерывно;

действие большого числа факторов на развитие экономического

явления во временных рядах выступает в виде обобщенного действия одного фактора времени;

инерционность развития явления, то есть определяется степень

сохранения темпов развития, направления развития, колеблемости уровня ряда. Инерционность не исключает наличие в динамике скачков;

масштаб системы и иерархия характеристик. Чем выше масштаб

системы ‘‘предприятие — экономика в целом’’, тем выше устойчивость и меньше колеблемость.

Использование особенностей временных рядов позволяет более точно строить по ним модель развития, отображающую процесс изменения явления во времени.

При разложении рядов динамики на отдельные компоненты следует принимать во внимание, что компоненты исходного временного ряда, по существу не наблюдаемы и являются только теоретическими величинами, абстракциями. Но несмотря на это, такой подход к разбиению фактических уровней временных рядов может оказаться довольно полезным для решения проблем анализа и прогнозирования на базе временных рядов.

Следует отметить, что уровни временного ряда не всегда являются составляющими всех трех компонентов одновременно. Единственным компонентом, который встречается во временных рядах является случайный компонент, который может быть представлен в сочетании с определенной тенденцией или с какими-то периодическими колебаниями. Чаще встречаются временные ряды, в которых можно установить тенденцию и случайный компонент, особенно при использовании годовых данных, где влияние сезонности не отражается.

Аналитически данное положение можно выразить уравнением вида:

                                 ,                                                                        (10.4)

где  f(t) — некоторая функция времени, описывающая  

                 тенденцию исходного временного ряда, называемая

                 трендом;

                    e(t) — случайная величина ( случайный компонент ).

Функция f(t) определяет общую тенденцию развития изучаемого явления. Поэтому прежде чем приступать к моделированию и прогнозированию социально-экономических явлений и процессов необходимо проверить гипотезу о наличии тенденции в исходном временном ряду.

10.2. Методы выявления тенденции временного ряда

Анализ и моделирование тенденции временного ряда целесообразно начинать с выявления наличия тенденции в целом. Для этой цели наиболее эффективны и дают хорошие результаты такие методы как кумулятивный Т-критерий.

Кумулятивный Т-критерий   позволяет определить наличие не только самой тенденции, но и ее математического выражения — тренда.

Выдвигается основная гипотеза ( Но: ) об отсутствии тенденции в исходном временном ряду.

Расчетное значение критерия определяется как отношение накопленной суммы квадратов отклонений эмпирических значений уровней  временного ряда от их среднего значения () и самих отклонений по формуле:

                                     ,                                                                   (10.5)

где    Zn — накопленный итог отклонений эмпирических значений

                от среднего уровня исходного временного ряда;

   —общая сумма квадратов отклонений, определяемая по

          формуле:

;

            yi – исходные значения признака;

                       - средний уровень исходного ряда динамики;

                      n – длина временного ряда (число уровней).

Если анализируется достаточно длинный временной ряд, то для расчета значений критерия можно использовать нормированное отклонение:

                                      .                                                         (10.6)

Расчетные значения кумулятивного Т-критерия и tp сравниваются с критическими при заданном уровне значимости a. Если расчетное значение Tp или tp превышает критическое (табличное) значение критерия (Ткр), то гипотеза об отсутствии тренда отвергается, следовательно в исходном временном ряду существует тенденция, описываемая трендом. В противном случае, если Тр < Ткр или tp < tкр, признается отсутствие тенденции в ряду динамики.

Тенденция исходного ряда динамики может быть трех видов: тенденция среднего уровня, дисперсии и автокорреляции.

Тенденция среднего уровня может быть выражена с помощью графического метода. Аналитически тенденция выражается с помощью некоторой математической функции f(t), вокруг которой варьируют эмпирические значения исходного временного ряда изучаемого социально-экономического явления. При этом теоретические значения, то есть значения, полученные по трендовым моделям в отдельные моменты времени, являются математическими ожиданиями временного ряда.

Тенденция дисперсии представляет собой тенденцию изменения отклонений эмпирических значений уровней временного ряда от теоретических, полученных по уравнению тренда.

Тенденция автокорреляции выражает тенденцию изменения корреляционной связи между отдельными, последовательными уровнями временного ряда.

Проверка на наличие тенденции среднего уровня и дисперсии может быть произведена методом сравнения средних уровней временного ряда и методом Фостера-Стюарта.

Метод сравнения средних уровней временного ряда предполагает, что исходный временной ряд разбивается на две приблизительно равные части по числу членов ряда, каждая из которых рассматривается как самостоятельная, независимая выборочная совокупность, имеющая нормальное распределение. При этом решаются две задачи.

I. Если временной ряд имеет тенденцию, то средние, вычисленные для каждой совокупности в отдельности, должны существенно, значимо различаться между собой. Если же расхождение незначимо, несущественно и носит случайный характер, то временной ряд не имеет тенденции средней.

Таким образом, проверка гипотезы       ( Н0 : ) о наличии тенденции в исследуемом ряду сводится к проверке гипотезы о равенстве средних двух нормально распределенных совокупностей, то есть:     

                                           Н0 :           (10.7)

                                              H1 :      .

Гипотеза проверяется на основе t-критерия Стьюдента, расчетное значение которого определяется по формуле:

,                 (10.8)

где   и  —  средние уровни временного ряда согласно  

                          порядка разбиения;                  n1 и n2  —  число уровней временного ряда, соответственно

                          первой и второй части;

 и  —  дисперсия уровней ряда.

Расчетное значение (tp) критерия сравнивается с его критическим (табличным) значением (tкр)  при уровне значимости a и числе степеней свободы n = n - 2.

Если tp > tкр, то гипотеза о равенстве средних уровней двух нормально распределенных совокупностей отвергается, следовательно расхождение между вычисленными средними значимо, существенно и носит неслучайный характер, и, следовательно, во временном ряду существует тенденция средней и существует тренд.

 II. Если временной ряд имеет тенденцию, то дисперсии, вычисленные для каждой совокупности в отдельности, должны существенно и значимо различаться между собой. Если же расхождение между ними не значимо, то временной ряд не имеет тенденции дисперсии. Таким образом проверяется гипотеза (H0:) об отсутствии тенденции в дисперсиях в исходном временном ряду, которая сводится к проверке гипотезы о равенстве дисперсий двух нормально распределенных совокупностей, то есть:

                                       H0 : ;      (10.9)

                                           H1 : .

Гипотеза проверяется на основе F-критерия Фишера-Снедекора, расчетное значение которого определяется по формуле:

                              ,            если

и                                 ,            если .                                    (10.10)

Проверка гипотезы осуществляется на основе сравнения расчетного и критического значений F-критерия, полученного при заданном уровне значимости a и числе степеней свободы n1 и n2.

Если ,  то     n1 = n2 - 1;

                          n2 = n1 - 1.

Если ,  то    n1 = n1 - 1;

                                       n2 = n2 - 1.                                                                     (10.11)

Гипотеза о равенстве дисперсий двух нормально распределенных совокупностей отвергается, если Fp > Fкр. Следовательно, расхождение между вычисленными дисперсиями значимо, существенно, носит неслучайный характер и в ряду динамики существует тенденция в дисперсиях и существует тренд.

Следует заметить, что данный метод дает вполне приемлемые результаты лишь в случае рядов с монотонной тенденцией. Если же ряд динамики меняет общее направление развития, то точка поворота тенденции может оказаться близкой к середине ряда, в силу этого средние двух отрезков ряда будут близки и проверка может не показать наличие тенденции.

Метод Фостера-Стюарта основан на двух простых характеристиках S и d.

,

,

где          ,

                                                   .                                         (10.12)

Суммирование производится по всем членам ряда. Значения Ut и lt определяются путем последовательного сравнения уровней.

Если значение уровня ряда превышает по своей величине каждый из предыдущих уровней, то величине Ut присваивается значение 1, в остальных случаях она равна 0. Таким образом:

ì 1, если yt > yt-1; yt-2; yt-3 ... y1;

   Ut =í

          î 0 в остальных случаях.        (10.13)

Наоборот, если значение уровня ряда меньше всех предыдущих, то lt присваивается значение 1.  Таким образом:

 ì 1, если yt < yt-1; yt-2; yt-3 ... y1;

  lt = í

 î 0 в остальных случаях.      (10.14)

Показатели S и d асимптотически нормальные и имеют независимые распределения, но на них влияет порядок расположения уровней во времени. Показатель S применяется для обнаружения тенденции изменения в дисперсиях, d — для обнаружения тенденций в средней. После того, как для исследуемого ряда найдены фактические значения d и S, проверяется гипотеза о том, можно ли считать случайными разности d - 0 и S - m. Гипотезы можно проверять, применяя t-критерий Стьюдента, то есть:

                                   ,                                                                      (10.15)

                                 ,                                                                     (10.16)

где  m — математическое ожидание величины S, определенное

                 для случайного расположения уровней во времени;

 s1 — средняя квадратическая ошибка величины S;

 s2 — средняя квадратическая ошибка величины d.

Значения m, s1, s2 табулированы.

Если td > tкр (a; n = n - 1), то гипотеза об отсутствии тенденции в средней отвергается, следовательно в исходном временном ряду существует тренд.

Если ts > tкр (a; n = n - 1), то гипотеза об отсутствии тенденции в дисперсиях отвергается, следовательно существует тенденция дисперсии и существует тренд.

Фазочастотный критерий знаков разностей Валлиса и Мура. По данному критерию предполагается расчет разностей уровней временного ряда (yt+1 –yt).  Нулевая гипотеза состоит в утверждении, что знаки этих разностей образуют случайную последовательность. Последовательность одинаковых знаков разностей называется фазой и рассчитывается число фаз h (без первой и последней фазы). Если знаки образуют случайную последовательность, то фактическое значение критерия запишется формулой (4.17).

(10.17)

При больших выборах (n>30) поправка на непрерывность может быть  опущена и формула расчета будет следующая:

(10.18)

где  n-число уровней временного ряда, распределенных нормально;

tф-фазочастотный критерий разностей;

h-число фаз

если tф>3, следовательно, данная последовательность случайна.

   

10.3. Методы оценки типа тенденции

Одной из основных задач моделирования тенденции является определение типа протекания процесса, имеющего место в данном явлении, направление роста и изменение, проходящие в нем.

Можно выделить следующие типы бизнес- процессов:

I. По возрастанию или убыванию уровней ряда:

монотонно- возрастающие;

монотонно- убывающие;

комбинированные.

II. По наличию насыщения и стремлению к некоторой предельной величине:

имеющие пределы насыщения;

не имеющие пределов насыщения.

III. По наличию экстремальных значений и перегибов:

процессы, имеющие экстремальные значения;

процессы, имеющие переходы от возрастания к убыванию или наоборот.

Для выявления типа развития могут использоваться различные методы и критерии.

Для выявления типа развития можно использовать известные способы сглаживания , которые можно разделить на три основные группы:

Сглаживание или механическое выравнивание отдельных членов ряда динамики с использованием фактических значений соседних уровней.

Выравнивание с применение кривой, приведенной между конкретными уровнями таким образом, чтобы она отображала тенденцию, присущую ряду, и одновременно освободила его от незначительных колебаний.

Выбор метода выявления основной тенденции развития зависит от технических возможностей счета и от умения применять соответствующие методы, а также от задач, стоящих перед исследованием. Если надо дать общую картину развития, его грубую модель, основанную на механическом повторении одних и тех же действий по увеличению интервала времени, то можно ограничится методом скользящей средней. Если же исследование требует подробного аналитического выражения движения во времени, то метод скользящей средней будет недостаточным. Надо использовать метод конечных разностей или метод наименьших квадратов.

Все методы выявления основной тенденции развития определяются на основе изучения фактического развития динамики. Они не отрываются от наблюдаемого статистикой эмпирического материала.

Методы выявления основной тенденции развития имеют разное логическое содержание и поэтому применяются ко временным рядам для разных целей. Основная их цель, как уже говорилось, заключается в том, чтобы вскрывать общие закономерности развития, затушеванные отдельными, иногда случайными обстоятельствами. Однако каждый из них имеет свои особенности.

Метод скользящих средних используется в том случае, когда необходимо представить общую картину развития, основанную на механическом повторении одних и тех же действий по увеличению интервала времени.

Метод скользящих средних дает оценку среднего уровня за некоторый период времени, чем больше интервал времени, к которому относится средняя, тем более плавным будет сглаживаемый уровень, но тем менее точно будет описана тенденция исходного ряда динамики.

Сглаживание ряда динамики с помощью скользящей средней заключается в том, что вычисляется средний уровень из определенного числа первых по порядку уровней ряда, затем – средний уровень из такого же числа уровней, начиная со второго, далее – начиная с третьего и т.д. Таким образом, при расчетах среднего уровня как бы «скользят» по ряду динамики от его начала к кону, каждый раз отбрасывая один уровень в начале и добавляя следующий. Отсюда название – скользящая средняя.

Каждая скользящая средняя – это средний уровень за соответствующий период, который относится к середине выбранного периода.

Определение скользящей средней по четному числу членов ряда осложняется тем, что средняя может быть отнесена только к середине между двумя датами, находящимися в середине интервала сглаживания.

Если число членов скользящей средней обозначить через 2к, то срединным будет уровень, относящийся к “к+1/2” члену ряда, т.е. имеет место сдвиг периода, к которому относится уровень. Например, средняя, найденная для четырех членов, относится к середине между вторым и третьим периодами, следующая средняя – к середине между третьим и четвертым, и т.д. Для устранения этого используют процедуру центрирования, которая заключается в нахождении средней из двух смежных скользящих средних для отнесения полученного уровня к определенной дате.

Метод простой скользящей средней приемлем, если графическое изображение ряда динамики напоминает прямую линию. В этом случае не искажается динамика исследуемого явления.

В случае, когда тенденция исходного ряда, характеризующего исследуемый процесс, не может быть описана линейным трендом, наиболее надежным является использование взвешенной скользящей средней.

Взвешенная скользящая средняя отличается от простой скользящей средней тем, что уровни, входящие в интервал усреднения, суммируются с различными весами. Это связано с тем, что аппроксимация сглаживаемого ряда динамики в пределах интервала сглаживания осуществляется с использованием уровней, рассчитанных по полиному /i – порядковый номер уровня в интервале сглаживания/. Полином первого порядка – есть уравнение прямой, следовательно, метод простой скользящей средней является частным случаем метода взвешенной скользящей средней. Коэффициенты находятся методом наименьших квадратов.

На первом этапе сглаживания определяются интервал сглаживания и порядок аппроксимирующего полинома. Принято считать, что при использовании полиномов высоких степеней и при меньших размерах интервалов сглаживание ряда динамики будет более гибким.

Центральная ордината параболы, например, принимается за сглаженное значение соответствующего фактическим данным уровня. Поскольку отсчет времени в пределах интервала сглаживания производится от его середины, то сглаженное значение уровня равно параметру а подобранной параболы и является соответствующей скользящей средней. Поэтому для сглаживания нет необходимости прибегать к процедуре подбора системы парабол, так как величину а можно получить как взвешенную среднюю из “к” уровней.

Определить тип тенденции также можно с использованием критерия Кокса-Стюарта, сущность которого заключается в следующем, исходный временной ряд делится на три группы уровней. Численность первой и третьей групп должны быть равны между собой и составлять п/з уровней каждая (при n, не  делящемся на три, средняя треть уменьшается на одно и два значения). При этом осуществляется фиксация знаков отклонения каждого уровня третьей группы от соответствующего уровня первой  группы. Из полученной суммы (S) положительных или отрицательных знаков (при возрастающем или убывающем тренде соответственно) вычисляется ожидаемое значение n/6. Считается, что вычисленная разность распределена нормально со стандартным отклонением : Ön/12  , то есть:

(10.19)

или при малых объемах (n<30) в формулу  вносится поправка Иейтса:

(10.20)

Для проверки расчетного значения Zф сравнивают его с табличным  Za. При Zф >Za гипотеза о наличие (возрастающего или убывающего) тренда принимается.

Таким образом, рассмотренные выше критерии основаны на определении знаков разностей последовательных уровней временных рядов или разностей определенных групп уровней ряда, то есть с их помощью предполагается определение наличия возрастающей или убывающей тенденции. Данные критерии дают удовлетворительные результаты, как правило, только для временных рядов не характеризующихся резкими колебаниями. При наличие ярко выражающихся колебаний в развитии социально-экономических явлений эти критерии могут давать противоположные результаты.

10.4. Модели тенденции бизнес-процессов

Метод аналитического выравнивания заключается в нахождении аналитической функции, выражающей развитие явления за рассматриваемый период времени. При этом решаются следующие задачи:

выбор вида уравнения, отображающего тип развития;

анализ схемы сбора фактических данных и определение

параметров модели;

в) определение методов преобразования исходных данных с

целью сведения сложных уравнений к более простым;

г) выявление степени близости теоретических и фактических

   данных.

Найденная модель позволяет получить выровненные или, как иногда называют, теоретические значения уровней, которые наблюдались бы  при совпадении динамики явления с кривой найденной модели.

По таким принципам можно построить частные модели, которые затем объединяются в комплексные модели, или системы моделей.

Рассмотрим определение тенденции на основе полинома первой и второй степени, то есть прямой.

Для уравнения прямой параметры определяются путем решения следующей системы нормальных уравнений методом наименьших квадратов:

                                                                                                            

                      10.5. Выбор формы тренда

Остановимся подробнее на проблеме выбора математической функции описания основной тенденции развития, то есть выбора подобной реальной динамике формы уравнения.

Для отображения основной тенденции развития явлений во времени или модели этого процесса применяются разные уравнения, полиномы разной степени, экспоненты, логистические кривые и другие функции.

Полиномы имеют следующий вид:

полином первой степени  ,

полином второй степени  ,                          (10.21)

полином n-й степени  .

Наиболее простым путем решения проблемы выбора формы трендовой модели можно назвать графический, на базе общей конфигурации графика фактических уровней ряда. Однако при этом подходе риск ошибочного выбора кривой очень велик. Разные специалисты, исходя из одного итого же графика, могут прийти к разным заключениям по поводу формы уравнения. Правильность выбора уравнения в некоторой мере зависит от масштаба графика. Однако в несложных случаях подход графического выбора может дать вполне приемлемые результаты.

Подбор класса выравнивающих кривых для временного ряда производится на основе качественного анализа представленного им процесса, а также если известны:

D1,D2,D3…….Di – первые, вторые, третьи и т.д. разности или абсолютные ускорения;

Tp - темпы роста первых абсолютных приростов уровней;

lgyi первые абсолютные приросты логарифмов уровней;

Тр – темпы роста.

В этих случаях критерии выбора типа кривой следующие (табл.10.1).

Таблица 10.1

Критерии выбора класса, выравнивающих кривых.

Показатель

Изменение уровней временного ряда

Формула уравнения

Наименование функции

более или менее постоянные

`yt=a0+a1t

линейная

уменьшающиеся

`yt=a0+a1/t

гиперболическая

изменяющиеся с насыщением

`yt=k/(1+be-at)

логистическая

D¢¢

постоянны

`yt=a0+a1t+ a2t2

параболическая 2-ой степени

D¢¢¢

постоянны

`yt=a0+a1t+ a2t2+ a3t3

параболическая 3-ой степени

D¢¢¢¢

постоянны

`yt=a0+a1t+ a2t2+ a3t3+ a4t4

параболическая 4-ой степени

TpD1

постоянны

`yt= a0×a1t (`yt=aet)

экспоненциальная

Tp

Сначало быстро растут, а затем рост изменяется

`yt=a0+a1lgt

полулогарифмическая парабола

lgyi

изменяется с постоянным темпом роста

`yt=kabt

кривая Гомперца

Для полиномиальных моделей характерно отсутствие прямой связи между абсолютными приростами и приростами уровней рядов динамики.

Предполагаемой функцией, отражающей процесс роста явления, может быть и экспонента  или . Экспоненты характеризуют прирост, зависящий от величины основания функции. Прологарифмировав левую и правую части, найдем ; , то есть логарифмические кривые. После замены   lg a0 = c0 и lg a1 = c1 получим уравнение , из которого видно, что логарифм ординаты линейно зависит от t.

Вторая функция после логарифмирования дает уравнение логарифмической параболы , в котором темп прироста линейно зависит от времени.

Надо помнить, что практика моделирования свидетельствует о том, что выбор тех или иных кривых всегда оказывается под воздействием представлений о желаемой форме кривой, и что на координатном поле, отображающем расстояние точек, можно построить бесконечное множество кривых. При этом необходимо отражать особенности процесса. Свойства процесса должны соответствовать свойствам функций, используемых для построения моделей.

Надо иметь в виду, что отдельные уравнения выражают определенный тип динамики.

Монотонное возрастание или убывание процесса характеризуют функции:

линейная;

параболическая;

степенная;

экспоненциальная простая (показательная) и производная от     нее

логарифмическая линейная;

сложная экспоненциальная и производная от нее

логарифмическая парабола;

гиперболическая (главным образом убывающих процессов);

комбинация их видов.

Для моделирования динамических рядов, которые характеризуются стремлением к некоторой предельной величине, насыщением, применяются логистические функции.

Логистическую функцию часто записывают в следующем виде:

или ,               (10.22)

где е— основание натуральных логарифмов.

Логистическая кривая симметрична относительно точки перегиба и при  стремится к нулю, а при  стремится к некоторой постоянной величине, к которой кривая асимптотически приближается. Если найти вторую производную от yt по t и приравнять ее к нулю, то для логистической кривой, выражаемой через е, место положения точки перегиба кривой равно: ; .

Тип процессов, характеризующихся наличием экстремальных значений, описывается кривой Гомперца, имеющей следующее выражение:

                                    .                                                      (10.23)

Возможны четыре варианта этой кривой. Для экономистов наибольшее значение имеет кривая, у которой lg a0 < 0 и a1 < 1. Развитие уровня такой кривой имеет следующие этапы: если коэффициент a1 меньше единицы при отрицательном значении lg a0, то на первом этапе прирост кривой незначителен. Он медленно увеличивается по мере роста t, но на следующем этапе прирост увеличивается быстрее, а затем, после точки перегиба, прирост начинает уменьшаться; подойдя к линии асимптоты, прирост кривой опять незначителен.

Прологарифмировав функцию Гомперца, получим:

.

Следовательно, после логарифмирования получим модифицированную экспоненту. Введя в модифицированной экспоненте величину, обратную yt, получим сходство с кривой Гомперца. Однако различие состоит в том, что изменение во времени первых разностей кривой Гомперца асимметрично, а у логистической кривой их изменение во времени имеет симметричный вид, напоминающий нормальное распределение.

При выборе формы тренда наряду с теоретическим анализом закономерностей развития изучаемого явления используются эмпирические методы, такие как:

расчет и анализ средней квадратической ошибки;

критерий наименьшей суммы квадратов отклонений

                   эмпирических и теоретических значений уровней

                   временного ряда.

метод разностного исчисления;

метод дисперсионного анализа;

Средняя квадратическая ошибка определяется по формуле:

                                   ,                                                            (10.24)

где k — число параметров уравнения.

Чем меньше значение ошибки, тем функция наилучшим образом описывает тенденцию исходного временного ряда.

На основе приведенного выше примера рассмотрим порядок расчета средней квадратической ошибки по линейному тренду и параболе второго порядка показателя объема платных услуг населению РФ.

Критерий наименьшей суммы квадратов отклонений эмпирических уровней от теоретических  также предполагает, что наилучшим образом тенденция описывается трендом, которому соответствует наименьшее значение суммы квадратов отклонений.

Дисперсионный метод анализа основывается на сравнении дисперсий.

Суть метода в следующем: общая дисперсия временного ряда делится на две части:

вариация вследствие тенденции Vf(t);

случайная вариация Ve  :

Vобщ = Vf(t) + VEt

Общая вариация определяется как сумма квадратов отклонений эмпирических значений уровней ряда (yt) от среднего уровня исходного временного ряда (), то есть из выражения вида:

.                                     (10.25)

Случайная вариация —  это сумма квадратов отклонений эмпирических значений уровней (yt) от теоретических полученных по уравнению тренда (), и определяется по выражению следующего вида:

.                                     (10.26)

Вариация вследствие тенденции определяется как разность общей и случайной вариаций из выражения вида:

Vf(t) = Vобщ - Ve.                                        (10.27)

На основе рассмотренных показателей вариации определяются различные виды дисперсии:

общая дисперсия:;                                   (10.28)

дисперсия случайного компонента: ,    (10.29)

где k — число параметров уравнения тренда.       

          дисперсия тенденции:   

.                      (10.30)

Выдвигается и проверяется гипотеза о том, что подходит или не подходит рассматриваемое уравнение тренда для описания тенденции исходного временного ряда.

Гипотеза проверяется на основе F-критерия Фишера-Снедекора, расчетное значение которого определяется по следующей формуле:

                                            ,    если                        (10.31)

Критическое значение критерия определяется по таблице табулированных значений (приложение ) следующим образом:

Если Fp > Fкр при заданном уровне значимости a и числе степеней свободы  (n1 = k - 1, n2 = n - k), то уравнение тренда подходит для отражения тенденции исходного временного ряда.

Анализ необходимо начинать с более простого уравнения к сложным, пока не подойдет.

Отдельно взятый критерий или метод при выборе формы тренда не обеспечивает правильность ее выбора. Необходим обязательно учет специфики объекта исследования, методов прогнозирования и оценки точности и надежности получаемых прогнозов.

После того, как определена форма трендовой модели (уравнения), необходимо проанализировать наличие, характер и закон распределения отклонений эмпирических значений от теоретических, полученных по уравнению тренда.

Глава 11. Моделирование фактора случайности в бизнес-процессах

Исследование случайного компонента проводится с целью решения двух основных задач:

оценки правильности выбора трендовой модели;

оценки стационарности случайного процесса.

При верном выборе формы тренда отклонения от него будут носить случайный характер, что означает, что изменение случайной величины et  не связано с изменением t.

Для этого определяются отклонения эмпирических значений от теоретических: et = yt - f(t) для каждого уровня исходного временного ряда.

Проверяется гипотеза H0: о том, что значения  случайной величины et случайны и величина et не зависят от времени.

Методами проверки данной гипотезы являются следующие:

            - коэффициент корреляции;

критерий серий, основанный на медиане выборки;

критерий “восходящих” и “нисходящих” cерий;

критерий min и max.

Наиболее простой сводится к расчету коэффициента корреляции между et (отклонениями от тренда) и фактором времени t, и проверке его значимости.

Критерий серий, основанный на медиане выборки.

Этапы реализации метода:

рассчитываются отклонения эмпирических значений от теоретических, полученных по уравнению тренда: e1, e2, ..., en  ().

et ранжируются, где e(1) — наименьшее значение: e(1), e(2), ..., e(n) в порядке возрастания или  убывания.

Определяется медиана отклонений emed.

Значения et сравниваются со значением emed и ставится знак ‘‘+’’ или ‘‘-’’:

et > emed — ‘‘+’’

     et < emed — ‘‘-’’

et = emed — пропускается уровень и ставится ‘‘0’’.

Таким образом получается ряд ‘‘+’’ и ‘‘-’’.

Выдвигается и проверяется следующая основная гипотеза H0 : если отклонения от тренда случайны, то их чередование должно быть случайным.

Последовательность ‘‘+’’ и ‘‘-’’ называется серией.

Определяется kmax(n) — длина наибольшей серии.

Определяется V(n) — число серий.

Выборка признается случайной, если одновременно выполняются неравенства          (a = 0,05):

                                   ì

í kmax(n) < [3,3(lg n + 1)];

î.                           (11.1)

Если хотя бы одно неравенство нарушается, то гипотеза о случайности отклонений уровней временного ряда от тренда отвергается.

Критерий ‘‘восходящих’’ и ‘‘нисходящих’’ серий.

Этапы реализации метода:

Последовательно сравниваются каждое следующее значение et+1 с предыдущим и ставится знак ‘‘+’’ или ‘‘-’’:

ei+1 > ei — ‘‘+’’

ei+1 < ei — ‘‘-’’

ei+1 = ei — учитывается только одно

                            наблюдение (другие опускаются).

Определяется kmax(n) — длина наибольшей серии.

Определяется V(n) — общее число серий.

Выдвигается и проверяется гипотеза H0 : о случайности выборки и подтверждается, если вполняются следующие неравенства

    (a = 0,05) :

ì

í;                   (11.2)

î kmax(n) £ k0(n),

где   k0(n) — число подряд идущих ‘‘+’’ или ‘‘-’’ в самой длинной

                     серии.

k0(n) определяется следующим образом:

N

k0(n)

n £ 26

26 < n £ 153

153 < n £ 1170

5

6

7

Если хотя бы одно из неравенств не выполняется, то гипотеза о случайном характере отклонений уровней временного ряда от тренда отвергается.

Глава 12. Моделирование периодической компоненты бизнес-процессов

  1.  Методы выявления сезонной компоненты

При рассмотрении квартальных или месячных данных многих социально-экономических явлений часто обнаруживаются определенные, постоянно повторяющиеся колебания, которые существенно не изменяются за длительный период времени. Они являются результатом влияния природно-климатических условий, общих экономических факторов, а также ряда многочисленных разнообразных факторов, которые частично являются регулируемыми. В статистике периодические колебания, которые имеют определенный и постоянный период, равный годовому промежутку, носят название «сезонных колебаний» или «сезонных волн», а динамический ряд в этом случае называют тренд-сезонным, или просто сезонным рядом динамики.

Сезонные колебания характеризуются специальным показателями, которые называются индексами сезонности (Is). Совокупность этих показателей отражает сезонную волну. Индексами сезонности являются процентные отношения фактических внутригодовых уровней к постоянной или переменной средней.

Для выявления сезонных колебаний обычно берут данные за несколько лет, распределенные по месяцам. Данные за несколько лет (обычно не менее трех) берутся для того, чтобы выявить устойчивую сезонную волну, на которой не отражались бы случайные условия одного года.

Если ряд динамики не содержит ярко выраженной тенденции в развитии, то индексы сезонности вычисляются непосредственно по эмпирическим данным без их предварительного выравнивания.

Для каждого месяца рассчитывается средняя величина уровня, например, за три года (), затем из них рассчитывается среднемесячный уровень для всего ряда () и в заключение определяется процентное отношение средних для каждого месяца к общему среднемесячному уровню ряда, то есть:

        (12.1)

Рассчитанные индексы сезонности характеризуют сезонную волну продажи молока во внутригодовой динамике, где пики продаж приводятся на февраль и июль месяцы.

Если же ряд динамики содержит определенную тенденцию в развитии, то прежде чем вычислить сезонную волну, фактические данные должны быть обработаны так, чтобы была выявлена общая тенденция. Обычно для этого прибегают к аналитическому выравниванию ряда динамики.

При использовании способа аналитического выравнивания ход вычислений индексов сезонности следующий:

- по соответствующему полиному вычисляются для каждого месяца (квартала) выравненные уровни на момент времени (t);

- вычисляются отношения фактических месячных (квартальных) данных (yi) к соответствующим выравненным данным (t) в процентах

;

- находятся средние арифметические из процентных отношений, рассчитанных по одноименным периодам в процентах Ii=(I1+I2+I3+…+In):n, где n – число одноименных периодов.

В общем виде формулу расчета индекса сезонности данным способом можно записать так:

        (12.2)

Выявление сезонной составляющей также может быть произведено на основе следующих методов.

Метод абсолютных разностей:

Для каждого месяца определяется средняя за 5 лет :

- определяется среднемесячный уровень для пятилетки:

звенья сезонной волны абсолютных разностей = :

II. Метод отношений помесячных средних () к средней за весь период:

, - индекс сезонности

где  - средняя для каждого месяца

 - общий среднемесячный уровень за весь период.         

Метод отношений помесячных уровней к средней месячной данного года:

для каждого месяца рассчитывается средняя величина показателя за каждый год:

определяется отношение каждого помесячного фактического уровня к этим средним:

определяется сумма по месяцам за 5 лет:

Метод относительных величин:

определяются цепные темпы роста:

определяется средняя для каждого месяца:

расчет скорректированных средних ( на основе перехода от цепных индексов к базисным):

- скорректированные средние с учетом поправки:

сопоставить скорректированные средние со 109,5 (средняя).

Метод относительных величин на основе медианы:

определяются цепные темпы роста помесячно (см.ранее);

цепные  ранжируются по возрастанию (помесячно);

определяется   Ме :                

скорректированные медианы:  

;

размер поправки ;

скорректированные  с учетом поправки:

сопоставить скорректированное значение  со средней.

Можно построить модель сезонной волны и численно определить размах сезонных колебаний, характер их проявления в различных отраслях народного хозяйства.

  1.  Модели сезонных колебаний

Моделью периодически изменяющихся уровней служит ряд Фурье:

                             ,                                  (12.3)

где     k — определяет номер гармоники ряда Фурье и может быть

                 взята с разной степенью точности (чаще от ‘‘1’’ до ‘‘4’’).

Параметры уравнения определяются методом наименьших квадратов, то есть по условию . Решая систему нормальных уравнений, получим:             

                .                                      (12.4)

Для изучения сезонности берется (n = 12) по числу месяцев в году.

Как правило, при выравнивании по ряду Фурье рассчитывают не более четырех гармоник и затем уже определяют, какая гармоника наилучшим образом отражает периодичность изменения уровней ряда.

Так, при  k=1: ;

  k=2: .                     (12.5)

Рассчитав остаточные дисперсии  для 2-х случаев, можно сделать вывод, какая гармоника Фурье наиболее близка к фактическим уровням ряда.

Моделирование сезонности проводится в следующей последовательности:

Определяется тенденция исходного ряда динамики и ее аналитическое выражение, например,  в виде линейного тренда:

.

2. Определяются  - теоретические уровни ряда динамики;

3. Определяется    ( ) - по месяцам года.

4. Определяются средние арифметические по месяцам года. Получается ряд индексов, характеризующих сезонную волну.

Определяется модель сезонной волны:

- ряд Фурье.

- порядковый номер гармонии.

                                                                                               Таблица 12.1

Множители гармонического анализа n=12

для расчета коэффициентов и

0

1

1

1

1

0

0

0

0

0,866

0,5

0

-0,5

0,5

0,866

1

0,866

0,5

-0,5

-1

-0,5

0,866

0,866

0

-0,866

0

-1

0

1

1

0

-1

0

-0,5

-0,5

1

-0,5

0,866

-0,866

0

0,866

-0,866

0,5

0

-0,5

0,5

-0,866

1

-0,866

-1

1

-1

1

0

0

0

0

-0,866

0,5

0

-0,5

-0,5

0,866

-1

0,866

-0,5

-0,5

1

-0,5

-0,866

0,866

0

-0,866

0

-1

0

1

-1

0

1

0

0,5

-0,5

-1

-0,5

-0,866

-0,866

0

0,866

0,866

0,5

0

-0,5

-0,5

-0,866

-1

0,866

 

- остатки от линейной тенденции.

Глава 13. Моделирование связных временных рядов

13.1. Проблема автокорреляции в анализе бизнес-процессов

Метод наименьших квадратов, используемый в регрессионном анализе для определения коэффициентов регрессии, основывается на предпосылке независимости друг от друга отдельных наблюдений одной и той же переменной. В динамических же рядах существует еще и автокорреляция. Поэтому величина коэффициентов регрессии, полученных по способу наименьших квадратов, не имеет нужных статистических свойств. Наличие автокорреляции приводит к искажению средних квадратических ошибок коэффициентов регрессии, что в свою очередь затрудняет построение доверительных интервалов по ним и проверку их значимости по соответствующим критериям. Автокорреляция также может привести к сокращению числа наблюдений ввиду невозможности потерять показатели одного и того же объекта за ряд лет, поскольку наблюдение одного объекта за десять лет качественно отличается от наблюдений десяти объектов за одно и то же время. Возникает автокорреляция и в отклонениях от трендов, а также в случайных остатках уравнений регрессии, построенных по многомерным рядам динамики.

Автокорреляция — это наличие сильной корреляционной зависимости между последовательными уровнями временного ряда.

Автокорреляция может быть следствием следующих причин:

Не учтен в модели существенный фактор, при этом его влияние отражается на величине отклонений, которые в этом случае показывают закономерность в изменении, связанную с изменением неучтенного фактора.

В модели не учитывается несколько факторов, влияние каждого из которых в отдельности не существенно, но при совпадении изменений этих факторов по направлению и по фазе в отклонениях может возникнуть автокорреляция.

Автокорреляция в отклонениях может появиться в случае, когда

неправильно выбрана форма связи между y и x.

Неверно выбран порядок авторегрессионой модели.

Вследствие специфичности внутренней структуры случайного

компонента.

Прежде чем делать вывод о тесноте связи между рассматриваемыми рядами динамики, необходимо проверять наличие автокорреляции в них, чтобы оценить степень зависимости между соседними уровнями временного ряда.

Наличие автокорреляции устанавливается с помощью коэффициента автокорреляции, который определяется на основе формулы коэффициента корреляции для парной (линейной) связи между уровнями исходного ряда и того же ряда, но сдвинутого на t шагов во времени:

                           ,                                                  (13.1)

где            yt     — эмпирические значения уровней ряда;

          yt+1 — эмпирические значения уровней, сдвинутые на один

                                         период времени (t = 1).

Возникает проблема заполнения последнего уровня ряда yt+1. В данном случае возможны два варианта:

Если значение последнего уровня мало отличается от первого, то чтобы ряд не укорачивался, его можно условно дополнить . Тогда

                                                                                        (13.2)

И коэффициент автокорреляции будет равен:

или                                                (13.3)

,                                               (13.4)

  где                                .                                              (13.5)

Затем аналогично рассчитывается коэффициент автокорреляции для всех временных рядов, входящих в связный.

Если ra > ra кр при заданном уровне значимости a и n, то в исходном временном ряду существует автокорреляция, в противном случае она отсутствует.

Последовательность значений коэффициентов автокорреляции  rt, вычисленных при t = 1, 2, ..., l, называют автокорреляционной функцией. Эта функция дает представление о внутренней структуре изучаемого экономического явления.

Для проверки автокорреляции в уровнях ряда также используется и критерий Дарбина-Уотсона. Гипотеза о наличии автокорреляции проверяется с помощью случайной величины:

                                                                            (13.6)

                 0 £ d £ 4.

Если автокорреляции в ряду нет, то значения критерия d колеблются вокруг 2.

Эмпирическое значение d сравнивается с табличным значением.

В таблице есть два значения критерия — d1 и d2, v и n,

где  d1 и d2 — нижняя и верхняя границы теоретических

                         значений;

         v — число факторов в модели.

         n — число членов временного ряда.

Если            1) d < d1 —  в ряду есть автокорреляция;

d > d2 — автокорреляции нет;

d1 £ d £ d2 — необходимо дальше исследовать

                                          автокорреляцию.

Иногда приходится при анализе рядов динамики исследовать вопрос о наличии или отсутствии автокорреляции не между самими уровнями ряда, а между их отклонениями от среднего уровня или от выровненного уровня.

При значении ra £ 0,3 необходимо проверять наличие автокорреляции в остатках с помощью следующего коэффициента Дарбина-Уотсона для остаточных величин:          

                              ,                                        (13.7)

где   xt — отклонения эмпирических значений уровней от

                         теоретических, полученных по уравнению тренда.

Существует теоретическое распределение значений dp для положительной автокорреляции с вероятностью 0,95,

где   d1 и d2 — нижняя и верхняя границы теоретических значений.

          n — число факторов в модели;

          n — число членов временного ряда.

При применении критерия Дарбина-Уотсона расчетное значение dp сравнивается с табличными d1 и d2. При этом возникает три исхода:

d < d1 => вывод о наличии автокорреляции в отклонениях;

d > d2 => вывод об отсутствии автокорреляции;

d1 £ d £ d2 => необходимо дальше исследовать автокорреляцию.

Возможные значения критерия находятся 0 £ d £ 4. Они различны для положительной и отрицательной автокорреляции. Так как при отрицательной автокорреляции d Î [2; 4], для проверки следует определять величину (4 - d).

Если в рядах динамики или в остаточных величинах имеется автокорреляция, то оценки коэффициентов регрессии, полученные методом наименьших квадратов, будут несмещенными, но неэффективными, так как наличие автокорреляции увеличивает дисперсии коэффициентов регрессии. Это затрудняет построение доверительных интервалов для коэффициентов регрессии и проверку их значимости.

Из этого следует сделать вывод, что прежде чем проводить корреляционно-регрессионый анализ временных рядов, необходимо исключить из исследуемых рядов автокорреляцию.

После того как установлено наличие автокорреляции следует приступить к построению модели.

13.2. Модели авторегрессионных преобразований

Основными моделями связных рядов динамики являются модели авторегрессии. Для того, чтобы получить эти модели необходимо исключить автокорреляцию.

В настоящее время разработано четыре способа исключения автокорреляции:

Основан на использовании, так называемых, последовательных или конечных разностей.

Модель данным методом имеет вид:

                     Dyt+1 = a0 + a1Dx1, t+1 + a2Dx2, t+1 + ... + akDxk, t+1.

Сущность метода заключается в последовательном исключении величины предшествующих уровней из последующих:

Dx = xi - xi-1                      Dy1 = yt - yt – 1

Dy = yi - yi-1                                . . .

Dx1 = xt - xt - 1

Dx2 = xt - 1 - xt - 2

При коррелировании разностей измеряется теснота связи между разностями последовательных величин уровней в каждом динамическом ряду.

Показателем тесноты связей между изучаемыми рядами является                                                                                                                                 коэффициент корреляции разностей:

                                       .                                        (13.7)

                2. По отклонениям эмпирических значений от выровненных по тренду.

Определяется тенденция исходных рядов динамики. Рассчитывается тренд, и его величина исключается из каждого уровня.

  Модель в общем виде может быть представлена следующим образом:

.

При коррелировании отклонений фактических уровней от выравненных необходимо:

произвести аналитическое выравнивание сравниваемых рядов по любому рациональному многочлену;

определить величину отклонения каждого фактического уровня ряда динамики от соответствующего ему выравненного значения;

произвести коррелирование полученных отклонений.

Коэффициент корреляции отклонений определяется по формуле:

                                     ,                                          (13.8)

где                                          

                                            .

Коэффициент корреляции отклонений характеризует степень связи между отклонениями фактических уровней сравниваемых рядов от соответствующих им выравненных уровней коррелируемых рядов динамики.

3. Метод Фриша-Воу.

Этот метод заключается в ведении времени как дополнительного факторного признака. Это возможно только в случае, если основные тенденции временных рядов одинаковы. В этом случае парные связи обращаются в связи многофакторные и расчеты коэффициента корреляции и уравнения регрессии проводятся методом многофакторной корреляции.

Коэффициент корреляции рассчитывается как множественный:       

                                ,                                              (13.9)

где                                 .

          — остаточная дисперсия;

             — общая дисперсия.

При построении многофакторных моделей по динамическим рядам возникает проблема мультиколлинеарности.

Под мультиколлинеарностью в этом случае понимают наличие сильной корреляционной зависимости между факторами рассматриваемых во взаимосвязи рядов динамики.

Мультиколлинеарность возникает вне зависимости от связи между результативным и факторным признаками. Она часто представляет опасность для правильного определения степени тесноты связи и оценки ее значимости.

Мультиколлинеарность затрудняет проведение анализа, так как усложняется процесс выделения наиболее существенных факторов и искажается смысл коэффициента регрессии.

Мультиколлинеарность возникает в том случае, когда факторными признаками выступают синтетические показатели. Например, в качестве факторов рентабельности могут рассматриваться объем реализации, производительность труда, фондоотдача, которые сильно коррелированы между собой.

На практике считают два фактора сильно коррелированными, если парный коэффициент корреляции между ними по абсолютной величине больше 0,8.

Довольно приблизительным методом обнаружения мультиколлинеарности является следующее правило. Фактор можно отнести к числу мультиколлинеарных, если коэффициент корреляции, характеризующий зависимость результативного признака от этого фактора больше, чем коэффициент множественной корреляции между результативным признаком и множеством остальных факторов.

Меры по устранению мультиколлинеарности в основном сводятся к следующему:

построение уравнений регрессии по отклонениям от тренда или по

   конечным разностям;

преобразование множества факторов в несколько ортогональных множеств с использованием методов многомерного анализа (факторного анализа или метода главных компонент);

исключение из рассмотрения одного или нескольких линейно связных факторов. Это исключение следует вести с крайней осторожностью,  основываясь на тщательном экономическом анализе.

Очистив таким образом уровни ряда динамики от автокорреляции и мультиколлинеарности, остается еще ‘‘подравнять’’ эти уровни по времени. Для этого необходимо рассмотреть вопрос о временном лаге.

Временным лагом называется запаздывание (или опережение) процесса развития, представленного одним временным рядом, по сравнению с развитием, предоставленным другим рядом.

Временной лаг определяется при помощи перебора парных коэффициентов корреляции между абсолютными уровнями двух рядов динамики. Возможно наличие временного лага и в данных, которые изображают динамику годовых показателей.

РАЗДЕЛ III. Прогнозирование тенденций в бизнес-процессах

Глава 14. Прогнозирование на основе одномерных временных рядов

14.1. Простейшие методы прогнозирования

Наиболее простыми методами прогнозирования по одномерным временным рядам, являются:

прогнозирование в предложении абсолютной неизменности

                        значений предшествующих уровней в будущем;

метод среднего уровня ряда;

метод среднего абсолютного прироста;

метод среднего темпа роста.

Рассмотрим каждый из названных методов.

Прогнозирование в предположении абсолютной неизменности значений предшествующих уровней исходит из утверждения, что каждое следующее прогнозное значение будет равно предыдущему значению признака, то есть:

       

            &