4522

Автоматизированные информационно-управляющие системы

Книга

Коммуникация, связь, радиоэлектроника и цифровые приборы

Цель работы Целью работы является изучение методов статистического моделирования временных рядов. Теоретическая часть Методы моделирования одномерных временных рядов Динамика рядов показателей состояния участков территориальных систем в общем случае...

Русский

2012-11-22

194.04 KB

17 чел.

Цель работы

Целью работы является изучение методов статистического моделирования временных рядов.

Теоретическая часть

Методы моделирования одномерных временных рядов

Динамика рядов показателей состояния участков территориальных систем в общем случае складывается из четырех компонентов:

  1.  тенденции, характеризующей долговременную основную закономерность развития исследуемого явления;
  2.  периодического компонента, связанного с влиянием сезонности развития явления;
  3.  циклического компонента, характеризующего циклические колебания, свойственные явления;
  4.  случайного компонента как результат влияния множества случайных факторов.

Под тенденцией понимают некоторое общее направление развития, долговременную эволюцию. Тенденцию ряда динамики представляют в виде гладкой кривой (траектории), которая аналитически выражается некоторой функцией времени, называемой трендом. Тренд характеризует основную закономерность движения во времени, свободную в основном от случайных воздействий.

В большинстве случаев полученная траектория связывается исключительно со временем. Предполагается, что рассматривая любое явление как функцию времени, можно выразить влияние всех основных факторов. Механизм их влияния в явном виде не учитывается. В связи с этим под трендом обычно понимают регрессию на время. Отклонение от тренда – есть некоторая случайная составляющая, характеризующая влияние случайных факторов. Исходя из этого, уровни временного ряда описываются следующим уравнением:

yt = f(t)+ε t ,                                      (1)

где f(t) – систематическая составляющая, характеризующая основную тенденцию явления во времени;  

      ε t – случайная составляющая.

Во временных рядах можно наблюдать тенденцию трех видов:

  1.  тенденции среднего уровня;
  2.  тенденции дисперсии;
  3.  тенденции автокорреляции.

Тенденцию среднего уровня наглядно можно представить графиком временного ряда. Аналитически она выражается в виде функции f(t), которой варьируются фактические значения изучаемого явления.

Тенденция дисперсии – это изменения отклонений эмпирических значений временного рода от значений, вычисленных по уравнению тренда.

Тенденция автокорреляции – это тенденция изменения связи между отдельными уровнями временного ряда.

Проверка гипотезы о существовании тенденции

Один из способов проверки основан на проверке средних уровней ряда: временной ряд разбивают на две примерно равные части по числу членов, каждая из которых рассматривается как некоторая самостоятельная выборочная совокупность, имеющая нормальное распределение. Если временной ряд имеет тенденцию, то среднее, вычисленное для каждой совокупности, должно существенно (значимо) различаться между собой. Если же расхождение будет незначительным (случайным), то временной ряд не имеет тенденции. Таким образом, проверка наличия тренда в исследуемом ряду сводится к проверке гипотезы о равенстве средних двух нормально распределенных совокупностей.

Необходимым элементом анализа тенденций является проверка гипотезы о равенстве дисперсий. Равенство дисперсий свидетельствует о том, что степень влияния различных факторов, определяющих значения параметров состояния, за исследуемый период времени остается неизменной.

Расчеты средних и эмпирического среднеквадратического отклонения S2j (j=1;2) осуществляется на основе соотношений

Здесь j – номер части временного ряда;

Пiji-е значение временного ряда в j-й части;

nj  -число членов в j-й части временного ряда.

Проверка гипотезы о равенстве дисперсий Но:  S12=S22 при уровне значимости α основана на  проверке соблюдения неравенства

Здесь α – уровень значимости, а Fрасч и mj (j=1,2)  определяется с помощью соотношения (3):

Число степеней свободы эмпирических оценок среднеквадратического отклонения mk (k=1,2) определяется по правилу :

mk =nk-1 ,      (4)

причём k=1 соответствует большей из оценок { S12 ; S22 }, а k=2 соответствует меньшей из оценок { S12 ; S22 }.

Табличные значения Fкр(α, m1, m2) приводятся в приложении 1.

Проверка основной гипотезы (о равенстве средних частей исходного ряда)

      

основана на  проверке выполнения неравенства

Если неравенство соблюдается, то гипотеза об отсутствии тенденций не противоречит фактическим данным. Если же не соблюдается, то гипотеза о наличии тенденций согласуется с фактическими данными.

Величина Трасч определяется с помощью соотношения

Значение tкр (α; m1+m2) приводится в приложении 2.

Характер тренда (в случае его наличия) определяется значениями . Если , то тренд убывающий. При   имеет место возрастающий тренд.

Пример 1. В табл.1 приведены данные, характеризующие значения параметра состояния П участка территориальной системы.

Значение временного ряда

Таблица 1

Год

1973

1974

1975

1976

1977

1978

1979

1980

1981

1982

1983

1984

1985

Значение параметра состояния

73,9

118,0

695,7

180,1

241,9

180,9

340,4

163,8

324,8

202,2

167,0

630,5

114,5

Год

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

Значение параметра состояния

119,5

425,7

63,7

24,18

70,8

29,7

21,8

31,75

46

47,89

44,18

15,36

4942

Разбив ряд на две равные части по 13 элементов (в первую вошли значения ряда с 1973 по 1985гг включительно; во вторую – с 1986 по 1988гг включительно) на основе (1) рассчитываются эмпирические дисперсии, значение которых составляет:

                 S12=37310.52;           S22=11762.08    

Значения m1 и m2 равны двенадцати. Значение Fрасч составляет Fрасч=3,17. При α=0,05 значение Fкр составляет 2,69. Неравенство Fрасч < Fкр не соблюдается, следовательно можно предположить, что с течением времени степень влияния различных факторов, определяющих значения параметра П1 изменилась.

Пример 2.

В табл.2 приведены данные, характеризующие значения параметра состояния П участка территориальной системы.

Таблица 2

Год

1973

1974

1975

1976

1977

1978

1979

1980

1981

1982

1983

1984

1985

Значение параметра состояния

255,0

212,1

306,4

260,8

173,3

121,1

121,1

231,1

181,3

253,4

723,1

557,5

462,5

Год

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

Значение параметра состояния

154,9

93,1

116,5

485,7

429,2

125,0

123,0

77,38

231,8

116,86

119,1

99,81

65,28

Разбив ряд на два разные части, рассчитаем эмпирических дисперсий:

S12=31976.26;           S22=17811.30

Значение Fрасч составляет Fрасч = 1.80. При  α=0.05  неравенство (2) соблюдается, следовательно можно переходить к проверке основной гипотезы. Среднее значение уровней заболеваемости, соответствующие различным частям временного ряда, составляют:

 

В соответствии c (6) значение Трасч составляет Трасч=2.0160. Значение tкр(α, m1 + m2) при α=0.05 составляет 2.064; неравенство (5) не соблюдается, следовательно гипотеза об отсутствии тенденции не противоречит фактическим данным.

Рассмотрим еще один метод анализа наличия тенденций, предложенный Ф. Фостером и А. Стюартом. Этот метод основан на том, что по данным исследуемого ряда определяются величины Ut и lt путем последовательного сравнения уровней ряда. Если какой-либо уровень ряда превышает по своей величине каждый из предыдущих уровней, то величине Ut присваивается значение 1, в остальных случаях она равна 0.

Таким образом,

И наоборот,  если уровень ряда меньше всех предыдущих, то величина lt равна 1, в остальных случаях она равна 0, т.е.

Затем находятся еще две величины s и d:

  S=∑St ,где St = Ut + lt;

       (9)

 d=∑dt ,где dt = Ut -lt

Суммирование проводится по всем членам ряда.

Величины S и d асимптотически нормальны и имеют независимые распределения. С помощью S можно проверить, существует ли тенденция изменения в дисперсиях, а d позволяет обнаружить тенденцию в средней. С этой целью проверяются две гипотезы о том, существенно ли отличаются d от 0 и S от μ, где μ – математическое ожидание S. Эти гипотезы проверяются с помощью случайных величин:

где σ1- средняя квадратическая ошибка S;

σ2- средняя квадратическая ошибка d.

Значения μ, σ1,σ2 табулированы для различных длин временных рядов n (приложение 3). Величины Т1 и Т2 имеют распределения Стьюдента с k=n-1 степенями свободы. Значения Т1 и Т2 , рассчитанные по (10), сравниваются с табличными, найденными по таблице критических точек распределения Стьюдента с k=n-1 степенями свободы при заданном уровне значимости α (приложение 5).

Если Т1расч>tкр(α, k), то делается заключение о том, что гипотеза о наличие тенденции в средней соответствует фактическим данным (тенденция есть), в противном случае нет основания отвергать гипотезу об отсутствии тенденции (тенденции нет). Аналогично, если Т2расч>tкр(α, k), то гипотеза о наличии тенденции дисперсии не противоречит фактическим данным, если же |Т2расч|<tкр(α, k), то нет оснований отвергать гипотезу об отсутствии тенденции в дисперсиях.

Пример3. В таблице 3 приведены значения параметра состояния П участка территориальной системы, соответствующие различным временным срезам.

Значения параметра состояния.

Таблица 3.

Год

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

Значение параметра состояния

14.1

9.3

19.4

19.7

5.4

24.2

13.8

24.5

14.7

16.6

5.6

16.2

25.3

11.9

18.5

U

-

0

1

1

0

1

0

1

0

0

0

0

1

0

0

l

-

1

0

0

1

0

0

0

0

0

0

0

0

0

0

В соответствии с (9) значения S=5+2=7; d=5-2=3; μ=4.636; σ1 =1.521;

σ2 =2.153 при n=15.

Тогда 

По данным таблицы, приведенной в приложении 5, находим tкр(0.01;14)=2.62 (обратите внимание на то, что в таблице приведены значения уровня значимости α двусторонней критической области. Т.е. при α=0.01,двусторонняя критическая область составит 0.02).

Т1расч<tкр(0.01, 14), т.е. нет оснований отвергать гипотезу об отсутствии тенденции в средней. Т2расч<tкр(0.01, 14), т.е. гипотеза об отсутствии тенденции изменения в дисперсиях не противоречит фактическим данным.

Моделирование тенденции временного ряда

Наиболее простым способом моделирования тенденции показателей, характеризующих состояние участков территориальной системы, является сглаживание (аналитическое выравнивание) временного ряда. Существуют различные приемы сглаживания, но суть их одна – замена фактических уровней ряда расчетными, имеющими значительно вариабельность, чем исходные данные.

Существуют различные приемы, позволяющие выбрать форму кривой, достаточно хорошо аппроксимирующей действительное развитие. Наиболее простой – это визуальный, на основе графического изображения временного ряда. По виду графика подбирается уравнение кривой, которая ближе всего подходит к эмпирическому тренду (траектории). Здесь могут быть

  1.  полиномы:

          

 

  *

      *

      *

 

Здесь πt  сглаженное (выровненное) значение уровня на момент t;

      aj (j=0,…,k) – параметры модели;

  1.  различные экспоненты:

 

  1.  логические кривые:

где е- основание натурального логарифма;

  1.  кривая Гомперца:

        и др.

Другой путь выявления формы кривой заключается в применении метода последовательных разностей. Суть этого метода заключается в нахождении первых, вторых и т. д. Разностей уравнений, т.е.

Расчет этих разностей ведется до тех пор, пока разности не будут приблизительно равными. Порядок этих разностей принимается за порядок искомого полинома.

Пример 4. По данным табл.4 проведем расчеты ut, lt, Δ(j)t (j=1,2).

Проверив наличие тенденции среднего уровня параметра состояния, определим порядок полинома, который можно принять за уравнение тренда.

d=14-0=1;  σ1=1.521;

Значения временного ряда

Таблица 4

Год

Значение параметра состояния

Ut

lt

Δ t(1)

Δ t(2)

1985

0.81

-

-

-

-

1986

0.85

1

0

0.04

1987

0.9

1

0

0.05

0.01

1988

0.94

1

0

0.04

-0.01

1989

0.98

1

0

0.04

0

1990

1.03

1

0

0.05

0.01

1991

1.07

1

0

0.04

-0.01

1992

1.12

1

0

0.05

0.01

1993

1.16

1

0

0.04

-0.01

1994

1.20

1

0

0.04

0

1995

1.26

1

0

0.06

0.02

1996

1.31

1

0

0.05

-0.01

1997

1.35

1

0

0.04

-0.01

1998

1.39

1

0

0.04

0

1999

1.42

1

0

0.03

-0.01

Так как Т1расч<tкр(0.01, 14), то делается заключение о том, что гипотеза об отсутствии тенденции в исследуемом роду не соответствует фактическим данным. С помощью последовательных разностей определим возможный порядок полинома для описания тенденции. Из табл.4 видно, что первые разности практически можно считать равными, а средняя арифметическая вторых разностей мала (0.001), ею можно пренебречь. Следовательно, тенденция изучаемого ряда может быть описана полиномом первой степени, т. е.    

Выбрать форму кривой можно исходя из теоретического анализа сущности изучаемого явления и опираясь на опыт и знания исследования. Если уровни ряда увеличиваются в арифметической прогрессии, то сглаживая производятся по прямой, а если рост уровней идет в геометрической прогрессии, то сглаживание следует производить по показательной функции. При сглаживании временных рядов, характеризующих явления, стремящихся к некоторой предельной величине насыщения, применяются логические функции.

После того, как форма кривой будет выбрана, необходимо оценить параметры соответствующей модели. Эта задача решается в основном методом наименьших квадратов.

 Задание на работу:

а) по данным, приведенным в файле «Варианты заданий» (таблица №1) оценить имеет ли место тенденция в значениях временного ряда.

б) из анализа конечных разностей определить предпочтительней порядок полинома.

Номер варианта задания совпадает с порядковым номером студента в групповом журнале.

Применение сплайн-функций для учета структурных изменений процесса

Функция П=f(t) является линейным сплайном над сеткой тогда, когда она непрерывна кусочно-линейная от t, и обозначается . Сеткой называют произвольное множество точек оси абсцисс , где .  Точки называют внутренними узлами, k- число узлов.

График сплайн-функции состоит из k прямолинейных отрезков, расположенных над k интервалами .

На рис.1 приведена линейная сплайн-функция над сеткой .

П

       t

              

Узлы входящие в , еще называют точками перелома или точками стыковки. Стыковка отрезков в узлах должна быть непрерывной.

Линейный сплайн можно задавать  его значениями во внутренних узлах и плюс его значение в концевых точках (узлах) и . Имея такие данные можно записать уравнение любого отрезка как уравнение  прямой, проходящей через две заданные точки. Так, уравнение j-ого отрезка будет иметь вид:

Выразим отсюда  

или

,

где

Полученное уравнение есть уравнение j-ого отрезка с угловым коэффициентом

Уравнение  линейной сплайн-функции можно записать в другом виде, вводя новые переменные

где j=2,3,4,...,k

Функция называется элементарными сплайн-функциями . Тогда линейный сплайн можно записать так:

Коэффициент есть угловой коэффициент сплайна над первым интервалом, а остальные коэффициенты , начиная  с , показывают изменение углового коэффициента при переходе от интервала (j-1) к интервалу j соответственно. Тогда полный коэффициент наклона сплайна над j-ом интервалом равен .

Уравнение можно рассматривать как детерминированную часть обычной регрессионной модели. Эта модель линейна  относительно неизвестных параметров . Ограничений на эти параметры нет.

Если , то можно сделать вывод, что коэффициенты наклона над (j-1)-м и j-м интервалами одинаковые, а если , эти коэффициенты наклона различны и тогда можно сделать вывод, что в точке происходит ”структурные изменения” какого-то типа. Наличие структурного изменения свидетельствует об изменении состояния изучаемого объекта в смысле П -го параметра.

Угловые коэффициенты сплайна по сути являются случайными величинами. Это обусловлено тем, что по своей природе случайными являются  значения . Поэтому для вынесения обоснованного заключения об изменении структуры процесса необходимо проанализировать, насколько существенно в статическом смысле различаются и .

Для оценки значимости  расхождения угловых коэффициентов сплайна может быть использован подход, основанный на отбраковке грубых ошибок наблюдений (подробно процедура описана в книге Н.В. Смирнова, И.В. Дубинина-Барковского “Курс теории вероятности и математической статистики для технических приложений”, М.:, Наука, 1969, с. 284-287). Основанием к использованию упомянутого подхода служит то ,что закон распределения угловых коэффициентов можно считать нормальным (обоснованием этого утверждения может служить энтропийный подход, описанный в книге Л.Т. Кузина “Основы кибернетики”, т.1, М., Энергия, 1973 с. 169-172).

Если распределения результатов наблюдений (в нашем случае значения угловых коэффициентов сплайнов) следует нормальному закону , то нулевой гипотезой является предположение о том, что принадлежит той же генеральной совокупности, как и все остальные k-1 наблюдения или, иными словами, не является результатом грубой ошибки. Здесь .

Проверка нулевой гипотезы заключается в том, что сравнивается по величине с некоторой критической границей x и гипотеза бракуется, если превосходит эту границу. Граница в свою очередь выбирается так, чтобы вероятность превзойти ее отвечала некоторому уровню q. Если параметры генеральной совокупности a и  известны, то закон распределения максимума в выборке из k членов можно определить. Событие равносильно тому, что все k наблюдений будут меньше x. Отсюда, полагая x=a+t* получим:

Таким образом, для нахождения верхней допустимой границы при гипотезе , отвечающей уровню значимости , нужно найти квантиль нормального распределения, отвечающей вероятности , или верхнюю процентную  точку этого распределения, отвечающую

В самом деле, определив такое , будем иметь в силу вышеприведенного соотношения для  :

и

Таким образом, обозначая верхнюю допустимую границу для при k наблюдениях через , имеем:

Значения определяются по значениям таблицы, приведенной в приложении 4.

В нашем случае значение a=0, значение  априорно неизвестно. Для проверки гипотезы можно использовать выборочное значение среднеквадратического отклонения S, либо значение размах   (учитывая то обстоятельство, что для нормального закона распределения ).  В этом случае верхнюю допустимую границу для при некотором уровне значимости q можно определить с помощью соотношения

Числа для уровней q=10%, 5%, 2.5%  и 1% берутся из таблицы, приведенной в приложении 5.

Они вычислены на основании исследования вероятности

величины ,

Если вместо в качестве “подозрительного” результата фигурирует , где , то применяется та же процедура, но критерий V заменяется на .

Наблюдения бракуется, если имеет место для данного q неравенство

Пример. Допустим во время анализа временного рода были рассчитаны значения шести угловых коэффициентов сплайна: -1; -0.5; 0; 0.5; 1; 2. Требуется определить имело ли место изменения состояния изучаемого объекта.

Решение. Учитывая то обстоятельство, что , оценку значения среднеквадратического отклонения определим по величине размаха:

Выбрав уровень значимости q=2.5% определим

По таблице приложения 4 при находим . Затем по формуле находим  

В примере , а потому можно считать, с уровнем значимости q=2.5%, что при угловом коэффициенте наклона =2 имеет место изменение структуры процесса.

 Задание на работу:

По данным, приведенным в файле «Варианты заданий» (таблица №2) оценить имеет ли место структурные изменения процесса.

Номер варианта задания совпадает с порядковым номером студента в групповом журнале.


Приложение 1.

Критические точки распределения F Фишера-Снедекора

(k1   - число степеней свободы большей дисперсии,

k2 - число степеней свободы меньшей дисперсии)

Уровень значимости =0.01

к2/к1

1

2

3

4

5

6

7

8

9

10

11

12

1

4025

4999

5403

5625

5764

5889

5928

5981

6022

6056

6082

6106

2

98,49

99,01

90,17

99,25

99,33

99,30

99,34

99,36

99,36

99,40

99,41

99,42

3

34,12

30,81

29,46

28,71

28,34

27,91

27,67

27,39

27,34

27,23

27,13

27,05

4

21,20

18

16,69

15,98

15,52

15,21

14,98

14,8

14,66

14,54

14,45

14,37

5

16,26

13,27

12,06

11,39

10,97

10,67

10,45

10,27

10,15

10,05

9,96

9,89

6

13,74

10,92

9,78

9,15

8,75

8,47

8,26

8,1

7,98

7,87

7,79

7,72

7

12,25

9,55

8,45

7,85

7,46

7,19

7

6,84

6,71

6,62

6,54

6,47

8

11,26

8,65

7,59

7,01

6,63

6,37

6,19

6,03

5,91

5,82

5,74

5,67

9

10,56

8,02

6,99

6,42

6,06

5,8

5,62

5,47

5,35

5,26

5,18

5,11

10

10,04

8,56

6,55

5,99

5,64

5,39

5,21

5,06

4,95

4,85

4,78

4,71

11

9,86

7,20

6,22

5,67

5,32

5,07

4,88

4,74

4,63

4,54

4,46

4,40

12

9,33

6,93

5,95

5,41

5,06

4,82

4,65

4,50

4,39

4,30

4,22

4,16

13

9,07

6,7

5,74

5,2

4,86

4,62

4,44

4,3

4,19

4,10

4,02

3,96

14

8,86

6,51

5,56

5,03

4,69

4,46

4,28

4,12

4,03

3,94

3,86

3,8

15

8,68

6,36

5,42

4,89

4,56

4,32

4,14

4,00

3,89

3,8

3,73

3,67

16

8,53

6,23

5,29

4,77

4,44

4,20

4,03

3,89

3,78

3,69

3,61

3,55

17

8,4

6,11

5,18

4,67

4,44

4,10

3,93

3,79

3,68

3,59

3,52

3,45

Уровень значимости =0.05

к2\к1

1

2

3

4

5

6

7

8

9

10

11

12

1

161

200

216

225

230

234

237

239

241

242

243

244

2

18,51

19,00

19,16

19,25

19,3

19,33

19,36

19,37

19,38

19,39

19,4

19,41

3

10,13

9,55

9,28

9,12

9,01

8,94

8,88

8,84

8,81

8,78

8,76

8,74

4

7,71

6,94

6,59

6,39

6,26

6,16

6,09

6,04

6,00

5,96

5,93

5,91

5

6,61

5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,78

4,74

4,7

4,68

6

5,99

5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,10

4,06

4,03

3,00

7

5,59

4,74

4,35

4,12

3,97

3,87

3,79

3,73

3,68

3,63

3,6

3,57

8

5,32

4,46

4,07

3,84

3,69

3,58

3,5

3,44

3,39

3,34

3,31

3,28

9

5,12

4,26

3,876

3,63

3,48

3,37

3,29

3,23

3,18

3,13

3,10

3,07

10

4,96

4,10

3,71

3,48

3,33

3,22

3,14

3,07

3,02

12,97

2,94

2,91

11

4,48

3,98

8,59

3,36

3,20

3,09

3,01

2,95

2,90

2,86

2,82

2,79

12

4,75

3,8

3,49

3,26

3,11

3,0

2,92

2,85

2,8

2,76

2,72

2,69

13

4,67

3,80

3,11

3,18

3,02

2,92

2,84

2,77

2,72

2,67

2,63

2,60

14

4,6

3,74

3,34

3,11

2,96

2,85

2,77

2,7

2,65

2,6

2,56

2,53

15

4,54

3,68

3,29

3,06

2,9

2,79

2,70

2,64

2,59

2,55

2,51

2,48

16

4,49

3,63

3,24

,301

2,85

2,74

2,66

2,59

2,54

2,49

2,45

2,12

17

4,45

3,59

3,2

2,96

2,91

2,7

2,62

2,55

2,5

2,45

2,41

2,38

Приложение 2.

Критические точки распределения Стьюдента

Уровень значимости  (двухсторонняя критическая область)

Число степеней свободы

0,1

0,05

0,02

0,01

0,002

0,001

1

6,31

12,7

31,82

63,7

318,2

637,0

2

2,92

4,3

6,97

9,92

22,33

31,6

3

2,35

3,18

4,54

5,84

10,22

12,9

4

2,13

2,78

3,75

4,6

7,17

8,61

5

2,01

2,57

3,37

4,03

5,89

6,86

6

1,94

2,45

3,14

3,71

5,21

5,96

7

1,89

2,36

3,00

3,5

4,79

5,4

8

1,86

2,31

2,9

3,36

4,5

5,04

9

1,83

2,26

2,82

3,25

4,3

4,78

10

1,81

2,23

2,76

3,17

4,14

4,59

11

1,8

2,2

2,72

3,11

4,03

4,44

12

1,78

2,18

2,68

3,05

3,93

4,32

13

1,77

2,16

2,65

3,01

3,85

4,23

14

1,76

2,14

2,62

2,98

3,79

4,14

15

1,75

2,13

2,6

2,95

3,73

4,07

16

1,75

2,12

2,58

2,92

3,69

4,01

17

1,74

2,11

2,57

2,9

3,65

3,96

18

1,73

2,10

2,55

2,88

3,61

3,92

19

1,73

2,09

2,54

2,86

3,58

3,88

20

1,73

2,09

2,53

2,85

3,55

3,85

21

1,72

2,08

2,52

2,83

3,53

3,82

22

1,72

2,07

2,51

2,82

3,51

3,79

23

1,71

2,07

2,5

2,81

3,49

3,77

24

1,71

2,06

2,49

2,8

3,47

3,74

25

1,71

2,06

2,49

2,79

3,45

3,72

26

1,71

2,06

2,48

2,78

3,44

3,71

27

1,71

2,05

2,47

2,77

3,42

3,69

28

1,7

2,05

2,46

2,76

3,4

3,66

29

1,7

2,05

2,46

2,76

3,4

3,66

30

1,7

2,01

2,46

2,75

3,39

3,65

40

1,68

2,02

2,42

2,7

3,31

3,55

60

1,67

2,00

2,39

2,66

2,23

3,46

120

1,66

1,98

2,36

2,62

3,17

3,37

1,64

1,96

2,33

2,58

3,09

3,29

0,05

0,025

0,01

0,005

0,001

0,0005


Приложение 3.

Значение средней  и стандартных  ошибок 1 и 2 

для n от 10 до 50

N

1

2

10

3.858

1.288

1.961

15

4.636

1.521

2.153

20

5.195

1.677

2.279

25

5.632

1.791

2.373

30

5.990

1.882

2.417

35

6.294

1.956

2.509

40

6.557

2.019

2.561

45

6.790

2.072

2.666

50

6.998

2.121

2.615

Приложение 4.

Обратная функция (x) (см. Примечание после таблицы)

p

0

1

2

3

4

5

6

7

8

9

0.00

-

-3.09

-2.88

-2.75

-2.65

-2.58

-2.51

-2.46

-2.41

-2.37

0.01

-2.33

-2.29

-2.26

-2.23

-2.20

-2.17

-2.14

-2.12

-2.10

-2.07

0.02

-2.05

-2.03

-2.01

-2.00

-1.98

-1.96

-1.94

-1.92

-1.91

-1.9

0.03

-1.88

-1.87

-1.85

-1.84

-1.83

-1.81

-1.80

-1.79

-1.77

-1.76

0.04

-1.75

-1.74

-1.73

-1.72

-1.71

-1.70

-1.68

-1.67

-1.66

-1.65

0.05

-1.64

-1.64

-1.63

-1.62

-1.61

-1.60

-1.59

-1.58

-1.57

-1.56

0.06

-1.55

-1.54

-1.54

-1.53

-1.52

-1.51

-1.51

-1.5

-1.49

-1.48

0.07

-1.48

-1.47

-1.46

-1.45

-1.45

-1.44

-1.43

-1.43

-1.42

-1.41

0.08

-1.41

-1.40

-1.39

-1.39

-1.38

-1.37

-1.37

-1.36

-1.35

-1.35

0.09

-1.34

-1.33

-1.33

-1.32

-1.32

-1.31

-1.30

-1.30

-1.29

-1.29

0.10

-1.28

-1.28

-1.27

-1.26

-1.26

-1.25

-1.25

-1.24

-1.24

-1.23

0.11

-1.23

-1.22

-1.22

-1.21

-1.21

-1.20

-1.20

-1.19

-1.19

-1.18

0.12

-1.18

-1.17

-1.17

-1.15

-1.16

-1.15

-1.15

-1.14

-1.14

-1.13

0.13

-1.13

-1.12

-1.12

-1.11

-1.11

-1.10

-1.10

-1.09

-1.09

-1.09

0.14

-1.08

-1.08

-1.07

-1.07

-1.06

-1.06

-1.05

-1.05

-1.05

-1.04

0.15

-1.04

-1.03

-1.03

-1.02

-1.02

-1.02

-1.01

-1.01

-1.00

-1.0

0.16

-0.99

-0.99

-0.99

-0.98

-0.98

-0.97

-0.97

-0.97

-0.96

-0.96

0.17

-0.95

-0.95

-0.95

-0.94

-0.94

-0.93

-0.93

-0.93

-0.92

-0.92

0.18

-0.92

-0.91

-0.91

-0.90

-0.90

-0.90

-0.89

-0.89

-0.89

-0.88

0.19

-0.88

-0.87

-0.87

-0.87

-0.86

-0.86

-0.86

-0.85

-0.85

-0.85

0.20

-0.84

-0.84

-0.83

-0.83

-0.83

-0.82

-0.82

-0.82

-0.81

-0.81

0.21

-0.81

-0.80

-0.80

-0.80

-0.79

-0.79

-0.79

-0.78

-0.78

-0.78

0.22

-0.77

-0.77

-0.77

-0.76

-0.76

-0.76

-0.75

-0.75

-0.75

-0.74

0.23

-0.74

-0.74

-0.73

-0.73

-0.73

-0.72

-0.72

-0.72

-0.71

-0.71

0.24

-0.71

-0.70

-0.70

-0.70

-0.69

-0.69

-0.69

-0.68

-0.68

-0.68

0.25

-0.67

-0.67

-0.67

-0.67

-0.66

-0.66

-0.66

-0.65

-0.65

-0.65

0.26

-0.64

-0.64

-0.64

-0.63

-0.63

-0.63

-0.63

-0.62

-0.62

-0.62

0.27

-0.61

-0.61

-0.61

-0.60

-0.6

-0.6

-0.59

-0.59

-0.59

-0.59

0.28

-0.58

0.58

-0.58

-0.57

-0.57

-0.57

-0.57

-0.56

-0.56

-0.56

0.29

-0.55

-0.55

-0.55

-0.54

-0.54

-0.54

-0.54

-0.53

-0.53

-0.53

0.30

-0.52

-0.52

-0.52

-0.52

-0.51

-0.51

-0.51

-0.50

-0.50

-0.50

0.31

-0.50

-0.49

-0.49

-0,49

-0,48

-0,48

-0,48

-0,48

-0,47

-0,47

0.32

-0.47

-0.46

-0.46

-0,46

-0,46

-0,45

-0,45

-0,45

-0,45

-0,44

0.33

-0.44

-0.44

-0.43

-0,43

-0,43

-0,43

-0,42

-0,42

-0,42

-0,42

0.34

-0.41

-0.41

-0.41

-0,40

-0,40

-0,40

-0,40

-0,39

-0,39

-0,39

0.35

-0.39

-0.38

-0.38

-0,38

-0,37

-0,37

-0,37

-0,37

-0,36

-0,36

0.36

-0.36

-0.36

-0.35

-0,35

-0,35

-0,35

-0,34

-0,34

-0,34

-0,33

0.37

-0.33

-0.33

-0.33

-0,32

-0,32

-0,32

-0,32

-0,31

-0,31

-0,31

0.38

-0.31

-0.30

-0.30

-0,30

-0,30

-0,29

-0,29

-0,29

-0,28

-0,28

0.39

-0.28

-0.28

-0.27

-0,27

-0,27

-0,27

-0,26

-0,26

-0,26

-0,26

0.40

-0.25

-0.35

-0.25

-0,25

-0,24

-0,24

-0,24

-0,24

-0,23

-0,23

0.41

-0.23

-0.23

-0.22

-0,22

-0,22

-0,21

-0,21

-0,21

-0,21

-0,20

0.42

-0.20

-0.20

-0.20

-0,19

-0,19

-0,19

-0,19

-0,18

-0,18

-0,18

0.43

-0.18

-0.17

-0.17

-0,17

-0,17

-0,16

-0,16

-0,16

-0,16

-0,15

0.44

-0.15

-0.15

-0.15

-0,14

-0,14

-0,14

-0,13

-0,13

-0,13

-0,13

0.45

-0.13

-0.12

-0.12

-0,12

-0,12

-0,11

-0,11

-0,13

-0,11

-0,10

0.46

-0.10

-0.10

-0.10

-0,09

-0,09

-0,09

-0,09

-0,08

-0,08

-0,08

0.47

-0.08

-0.07

-0.07

-0,07

-0,07

-0,06

-0,06

-0,06

-0,06

-0,05

0.48

-0.05

-0.05

-0.05

-0,04

-0,04

-0,04

-0,04

-0,03

-0,03

-0,03

0.49

-0.03

-0.02

-0.02

-0,02

-0,02

-0,01

-0,01

-0,01

-0,01

-0,00

0.50

0.00

0.00

0.01

0,01

0,01

0,01

0,02

0,02

0,02

0,02

0.51

0.03

0.03

0.03

0,03

0,04

0,04

0,04

0,04

0,05

0,05

0.52

0.05

0.05

0.06

0,06

0,06

0,06

0,07

0,07

0,07

0,07

0.53

0.08

0.08

0.08

0,08

0,09

0,09

0,09

0,09

0,10

0,10

0.54

0.10

0.10

0.11

0,11

0,11

0,11

0,12

0,12

0,12

0,12

0.55

0.13

0.13

0.13

0,13

0,14

0,14

0,14

0,14

0,15

0,15

0.56

0.15

0.15

0.16

0,16

0,16

0,16

0,17

0,17

0,17

0,17

0.57

0.18

0.18

0.18

0,18

0,18

0,19

0,19

0,19

0,20

0,20

0.58

0.20

0.20

0.21

0,21

0,21

0,21

0,22

0,22

0,22

0,23

0.59

0.23

0.23

0.23

0,24

0,24

0,24

0,24

00,25

0,25

0,25

0.60

0.52

0.26

0.26

0,26

0,26

0,27

0,27

0,27

0,27

0,28

0.61

0.28

0.28

0.28

0,29

0,29

0,29

0,30

0,30

0,30

0,30

0.62

0.31

0.31

0.31

0,31

0,32

0,32

0,32

0,32

0,33

0,33

0.63

0.33

0.33

0.34

0,34

0,34

0,35

0,35

0,35

0,35

0,36

0.64

0.36

0.36

0.36

0,37

0,37

0,37

0,37

0,37

0,38

0,38

0.65

0.39

0.39

0.39

0,39

0,40

0,40

0,40

0,40

0,40

0,40

0.66

0.41

0.42

0.42

0,42

0,42

0,43

0,43

0,43

0,43

0,44

0.67

0.44

0.44

0.45

0,45

0,45

0,45

0,45

0,46

0,46

0,46

0.68

0.47

0.47

0.47

0,48

0,48

0,48

0,48

0,49

0,49

0,49

0.69

0.5

0.50

0.50

0,50

0,51

0,51

0,51

0,52

0,52

0,52

0.70

0.52

0.53

0.53

0,53

0,54

0,54

0,54

0,54

0,55

0,55

0.71

0.55

0.56

0.56

0,56

0,57

0,57

0,57

0,57

0,58

0,58

0.72

0.58

0.59

0.59

0,59

0,59

0,60

0,60

0,60

0,61

0,61

0.73

0.61

0.62

0.62

0,62

0,63

0,63

0,63

0,63

0,64

0,64

0.74

0.64

0.65

0.65

0,65

0,66

0,66

0,66

0,67

0,67

0,67

0.75

0.67

0.68

0.68

0,68

0,69

0,69

0,69

0,70

0,70

0,70

0.76

0.71

0.71

0.71

0,72

0,72

0,72

0,72

0,73

0,73

0,74

0.77

0.74

0.74

0.75

0,75

0,75

0,76

0,76

0,76

0,78

0,77

0.78

0.77

0.78

0.78

0,78

0,79

0,79

0,79

0,79

0,80

0,80

0.79

0.81

0.81

0.81

0,82

0,82

0,82

0,82

0,83

0,83

0,84

0.80

0.84

0.85

0.85

0,85

0,86

0,86

0,86

0,86

0,87

0,87

0.81

0.88

0.88

0.89

0,89

0,89

0,900

0,90

0,90

0,91

0,91

0.82

0.92

0.92

0.92

0,93

0,93

0,93

0,94

0,91

0,95

0,95

0.83

0.95

0.96

0.96

0,97

0,97

0,97

0,98

0,98

0,99

0,99

0.84

0.99

1.00

1.00

1,01

1,01

1,02

1,02

1,02

1,03

1,03

0.85

1.04

1.04

1.05

1,05

1,05

1,06

1,06

1,06

1,07

1,08

0.86

1.08

1.09

1.09

1,09

1,10

1,10

1,11

1,11

1,12

1,12

0.87

1.13

1.13

1.14

1,14

1,15

1,15

1,16

1,16

1,17

1,17

0.88

1.18

1.18

1.19

1,19

1,20

1,20

1,21

1,21

1,22

1,22

0.89

1.23

1.23

1.24

1,24

1,25

1,25

1,26

1,26

1,27

1,27

0.90

1.28

1.29

1.29

1,30

1,30

1,31

1,32

1,32

1,33

1,33

0.91

1.34

1.35

1.35

1,36

1,37

1,37

1,38

1,38

1,39

1,40

0.92

1.41

1.41

1.42

1,43

1,43

1,44

1,45

1,45

1,45

1,47

0.93

1.48

1.48

1.49

1,50

1,51

1,51

1,52

1,52

1,54

1,54

0.94

1.55

1.56

1.57

1,58

1,59

1,60

1,61

1,61

1,63

1,64

0.95

1.64

1.65

1.66

1,67

1,68

1,70

1,71

1,71

1,73

1,74

0.96

1.75

1.76

1.77

1,79

1,80

1,81

1,83

1,83

1,85

1,87

0.97

1.88

1.90

1.91

1,93

1,94

1,96

1,98

1,98

2,01

2,03

0.98

2.05

2.07

2.10

2,12

2,14

2,17

2,20

2,20

2,26

2,29

0.99

2.33

2.37

2.41

2,46

2,51

2,58

2,65

2,65

2,88

3,09

Приложение 5.

Квантили распределения величины  

или

n     \     q

0.10

0.05

0.025

0.01

3

1.406

1.412

1.414

1.414

4

1.645

1.689

1.710

1.723

5

1.791

1.869

1.917

1.955

6

1.894

1.996

2.067

2.130

7

1.974

2.093

2.182

2.265

8

2.041

2.172

2.273

2.374

9

2.097

2.237

2.349

2.464

10

2.146

2.294

2.414

2.540

11

2.190

2.343

2.470

2.606

12

2.229

2.387

2.519

2.663

13

2.264

2.426

2.562

2.714

14

2.297

2.461

2.602

2.759

15

2.326

2.493

2.638

2.800

16

2.354

2.523

2.670

2.837

17

2.380

2.551

2.701

2.871

18

2.404

2.557

2.728

2.903

19

2.426

2.600

2.754

2.932

20

2.447

2.623

2.778

2.959

21

2.467

2.644

2.801

2.984

22

2.486

2.664

2.823

3.008

23

2.504

2.683

2.843

3.030

24

2.520

2.701

2.862

3.051

25

2.537

2.717

2.880

3.071

Примечание. В таблице даны значения обратной функции (x) для нормального распределения, т.е. величина отклонений, вероятность  не превзойти которые равна

,

где  второе  слагаемое в правой части представляет  нормированную функцию Лапласа (при аргументе ).

Пример. Пусть требуется найти величину отклонения . Вероятность для нормированной нормально распределенной (с параметрами a и ) величины Y равна p=0.877.

По таблице 4 при аргументе p=0.877 находим .

Повышение адекватности моделей на базе исходной выборки

Под адекватностью моделей понимают ее соответствие изучаемому явлению. Адекватностью модели связи признаков проявляется в способности правильно описывать реальную структуру зависимости результативного признака от факторных.

Для выяснения причин неадекватности моделей проводят анализ характера отклонений расчетных значений показателя от фактических. С этой целью строят диаграммы зависимости  фактических значений показателя y от его величины, полученной с помощью модели . В ней по оси абсцисс отложены значения , по оси ординат y. Каждый прогноз отображается точкой с координатами . Отклонение от биссектрисы координатного угла отражают расхождение расчетных и реальных значений показателя. Расположение точки выше биссектрисы  свидетельствует о превышении фактических значений над . Если больше y, то соответствующие точки находятся ниже биссектрисы.

Существенную роль играет анализ расположения точек на диаграммах. Их скопление в определенных участках говорит о систематической погрешности модели. Анализ систематических погрешностей позволяет производить корректировку походной модели, например, методом кусочно-линейной аппроксимации.

Методику построения кусочно-линейной модели продемонстрируем следующим примером. В таблице 1 приведены значения выходного параметра y, значения , рассчитанное по модели

где ошибка аппроксимации модели (1) и ошибка аппроксимации кусочно-линейной моделью.

Номер измерения

Значение y

Значение x

Значение

Ошибка аппроксимации модели (1)

Ошибка аппроксимации кусочно-линейной моделью

1

18,3

9,2

18,2

0,1

-0,8

2

22,0

12,1

18,9

3,1

2,2

3

19,4

14,6

19,4

0,0

-0,9

4

24,7

17,5

20,1

4,6

3,7

5

6,4

18,3

20,2

-3,8

-4,7

6

21,9

19,7

20,5

1,4

0,5

7

18,9

20,8

21,8

-1,9

0,5

8

17,0

24,7

21,6

-4,6

-2,3

9

19,3

27,1

22,2

-2,9

-0,6

10

24,4

28,5

22,5

1,9

4,2

11

22,8

33,0

23,5

-0,7

1,6

12

18,2

34,3

23,9

-5,7

-3,4

13

25,4

39,6

24,9

0,5

0,0

14

23,4

41,2

25,3

-1,9

-2,5

15

28,9

42,6

25,6

3,3

2,7

16

27,3

44,0

26,9

1,4

0,9

17

24,5

45,8

26,3

-1,8

-2,3

18

28,1

46,4

26,4

1,7

1,2

Параметры модели (1) рассчитывались методом наименьших квадратов.

Для анализа адекватности модели построена диаграмма зависимости y и , представленная на рис.1

Рис.1. Диаграмма зависимости y и .

Участки регулярных расположений точек на диаграмме отделены линиями  . Эти линии разбивают совокупность точек на три группы с относительно схожими погрешностями. В первую группу входят измерения с номерами 1-6; во вторую группу – с номерами 7-12; в третью – с номерами 13-18.

Параметры модели (1) определялись с помощью соотношений

где n=18, а значения берутся из таблицы.

Аналогичные группы получаются на основании диаграммы зависимости ошибки аппроксимации

от факторного признака x, изображенной на рис.2.

рис.2.

Диаграмма зависимости ошибки аппроксимации от факторного признака.

Средние ошибки аппроксимации в первой, второй и третьей группах соответственно равны:

Групповые модели имеют вид:

Для сравнения общей модели (1) и кусочно-линейной модели (5) рассчитаны их эмпирические ошибки. Эмпирическая ошибка общей модели

 

где определяется по (4). Эмпирическая ошибка кусочно-линейной модели

где  

здесь j – номер группы .

 Задание на работу:

По данным, приведенным в файле «Варианты заданий» (таблица №3) оценить целесообразность повышения адекватности модели.

Номер варианта задания совпадает с порядковым номером студента в групповом журнале.


 

А также другие работы, которые могут Вас заинтересовать

8715. Спряження зовнішніх пристроїв з комп’ютером за допомогою шин ISA та PCI 87 KB
  Спряження зовнішніх пристроїв з компютером за допомогою шин ISAта PCI План 7.1. Будова шини ISA 7.2. Сигнали шини ISA 7.3. Цикли шини 7.1. Будова шини ISA Шина ISA (Industrial Standart Arhitecture) є фактично стандартною шиною для персон...
8716. Архітектура і програмування шини USB 177.5 KB
  Архітектура і програмування шини USB План Виникнення USB. Архітектура шини USB. Апаратне забезпечення USB. Внутрішня будова шини. Логічні рівні обміну. Внутрішня організація пристроїв. Апаратне забезпечення USB. В...
8717. Исторические персоналии 365 KB
  Исторические персоналии Аристотель (384-322 гг. до н. э.) - древнегреческий философ, ученый-экономист, ученик Платона. Он впервые в истории человечества исследовал экономические явления и процессы, пытаясь выявить общие закономерности, ввел в у...
8718. Понятие общества несколько вариантов 35.5 KB
  Понятие общества Вариант-1 Существует несколько понятий общество. В узком смысле общество: 1) группа людей, объединившихся для общения и совместного выполнения какой-либо деятельности 2) конкретный этап в историческом развитии народа или страны...
8719. Человек, индивид, личность 37 KB
  Человек, индивид, личность. Вариант 1 Индивид - это единичный конкретный человек, рассматриваемый в качестве биосоциального существа. Человек - это лицо, принадлежащее к человеческому роду, а также обладающее вс...
8720. Человеческая деятельность, ее многообразие 39.5 KB
  Человеческая деятельность, ее многообразие. Вариант 1 Деятельность - это форма активности человека, направленная на преобразование им окружающего мира. Структуры деятельности: Объект - это то на что направлена деятельность. Субъек...
8721. Многообразие деятельности 25 KB
  Многообразие деятельности Со второй половины XIX века, когда было признано, что человек - продукт биологической эволюции, центральным для всей теории развития человека как живого существа стал вопрос об основном отличии людей от высокоорганизов...
8722. Деятельность и общение 32.5 KB
  Деятельность и общение. Вариант 1 Деятельность - это форма активности человека, направленная на преобразование им окружающего мира. Общение - это процесс обмена информацией между равноправными субъектами деятельности. Виды общения...
8723. Социальные нормы и отклоняющееся поведение 40.5 KB
  Социальные нормы и отклоняющееся поведение. Вариант 1 Социальные нормы - это установленные в обществе правила, образцы, эталоны поведения людей, регулирующие общественную жизнь. Виды социальных норм: Нормы морали - это т...