19120

Прогнозирование и регрессионный анализ

Лабораторная работа

Информатика, кибернетика и программирование

Пусть требуется исследовать зависимость Y(x), причем величины у и x измеряются в одних и тех ж экспериментах. Будем считать, что погрешность измерения величины х пренебрежимо мала по сравнению с погрешностью измерения величины у

Русский

2014-03-24

91.16 KB

27 чел.

Лабораторная работа № 3

Прогнозирование и регрессионный анализ

Цели работы:

Получение навыков по прогнозированию и регрессионному анализу  в таблицах Excel

3.1.  Постановка задачи:

Пусть требуется исследовать зависимость  Y(x), причем величины у и x  измеряются в одних  и  тех  ж  экспериментах.  Будем  считать,  что  погрешность измерения  величины  х пренебрежимо  мала  по  сравнению  с  погрешностью измерения  величины  у.  Таким образом,  результаты  эксперимента  можно рассматривать  как  выборочные  значения случайной  величины  η(x),  зависящей  от х как от параметра. Регрессией называют зависимость условного математического  ожидания этой величины от  x, т.е.  Y(x) = M(η|x). Задача  регрессионного  анализа состоит  в  восстановлении  функциональной  зависимости  y(х)  по результатам  измерений (xi,yi), i = 1,2,…,7. 

Аппроксимируем  искомую зависимость  y(x)  функцией  f(x,a1, … ,  ak).  Это означает, что результаты измерений можно представить в виде

где a1,…, ak неизвестные параметры регрессии;

ξi, - случайные величины, характеризующие погрешность эксперимента,

Обычно предполагается, что  ξi  -  это  независимые нормально  распределенные 2  2случайные величины с M ξi  = 0 и одинаковыми дисперсиями М ξi = σ .

Параметры  a1,...,ak следует  выбирать  такими,  чтобы  отклонение предложенной функциональной зависимости от результатов экспериментов было  минимальным. Часто в качестве меры отклонения принимают величину

На практике регрессионный анализ состоит из трех этапов:

1) выдвижение гипотезы о виде функции f(x,a1, … , ak);

2) определение неизвестных параметров (а1, …,аk) по имеющимся данным;

3)  проверка согласованности выдвинутой  гипотезы  с  экспериментальными данными.

Мера  достоверности  регрессионных  зависимостей  оценивается  величиной R2 (квадрат коэффициента корреляции), находящейся в пределах 0≤R2≤1

При  R2  =  0  величины,  для  которых  определяются  уравнения  регрессии, являются независимыми;  при  R2  =  1  имеет  место  функциональная  зависимость.

Принято считать допустимым ≥ 0,7.

Чем больше статических данных, используемых при определении уравнения регрессии, тем точнее будет определена исходная зависимость, если таковая существует. Тем  не  менее  существует  минимальное  количество  необходимыхисходных данных р, с помощью которого можно найти уравнение регрессии. Это количество определяется по формуле:

где k – количество неизвестных параметров в искомом уравнении регрессии, Рассмотренная ранее математическая модель соответствует парной регрессии, поскольку требуется найти зависимость между функцией и  одной переменной. Регрессия называется  множественной,  если  она  описывает зависимость функции от нескольких переменных. Еще  один способ  классификации уравнений регрессии по виду зависимостей, по этому  критерию уравнения регрессии делятся на линейные и нелинейные.

В дальнейшем будут рассматриваться следующие модели:

1)  парная линейная регрессия: у = a2 x+ a1; x

2)  парная нелинейная регрессия (экспоненциальная модель) y = a1a2 ;

3)  множественная линейная регрессия y = a2x2+a3x3+…akxk+a1.

Ход работы:

По исходным данным об объемах реализации фирмой товаров за десять недель.Оопределить вид зависимости между наблюдаемыми величинами х и у, где х - отчетная неделя, у - объем продажи за отчетную неделю, а также спрогнозируем объемы реализации на три предстоящих недели.

Исходная таблица

Для  расчетов  были  использованы  функции  рабочего  лист  ТЕНДЕНЦИЯ, РОСТ, ЛИНЕЙН,  ЛГРФПРИБЛ,  LN,  EХР.  При  этом  большинство  расчетных формул  было введено  в  диапазон  ячеек.  Это  означает,  что  при  вводе  формул были выполнены следующие шаги:

1) выделен диапазон ячеек, в которые вводится формула;

2) в строке ввода набрана требуемая формула;

3) набор формулы завершен нажатием клавиш <Ctrl>+<Shift>+<Enter>.

Формула,  введенная  в  диапазон,  автоматически  обрамляется  в  Excel фигурными скобками {}.

При  решении  рассматриваемой  задачи  в  диапазон  ячеек  В12:В14  была введена

формула построения линейною тренда {=ТЕНДЕНЦИЯ(В2:В11;A2:11;A12:А14)}.

В  диапазон  ячеек  С2:С14  введена  формула  построения  экспоненциального тренда

{=РОСТ (В2:В11;А2:А11;А2:А14)}.

Линейный  и  экспоненциальный  тренды  тесно  связаны  между  собой.  В диапазон ячеек D2:D10 введена формула

{=ЕХР(ТЕНДЕНЦИЯ(LN(В2:В11);A2:А11;А2:А14))};

Как видно из таб. 1, значения в диапазонах С2:С14 и D2:D14 совпадают. В диапазоны ячеек F2:G2 и F3:G3 введены формулы

{=ЛИНЕЙН (В2:В11;А2:А11)}

{=ЛГРФПРИБЛ(В2:В11;А2:А11)}

для определения параметров линейной и экспоненциальной моделей

Как  видно  из  рис. ,  величина  R2  для  экспоненциальной  модели меньше аналогичной величины для линейной модели.  Таким образом, в данном случае линейная модель у = 12,4666 x +  более достоверно описывает зависимость между наблюдаемыми величинами. Поэтому для прогноза следует использовать данные, находящиеся в ячейках В12:В14.

Объем реализации

(экспоненциальная модель)

Объем реализации

(линейная модель)

Вывод: получили навыки по прогнозированию и регрессионному анализу  в таблицах Excel.


 

А также другие работы, которые могут Вас заинтересовать

73450. Современный взгляд на педагогическое наследие А.С. Макаренко 129.5 KB
  Антон Семенович Макаренко яркая личность в области педагогики и социального проектирования ХХ века. Его наследие составляют педагогические сочинения в восьми томах: результаты педагогической деятельности, художественно-педагогические произведения и материалы педагогической практики...
73451. Особенности работы педагога по формированию здорового образа жизни у школьников 128.5 KB
  Правильное отношение к своему здоровью следует формировать у человека с детства, чтобы воспитать гармонично развитую, здоровую личность. В последние годы одной из ведущих стала идея валеологизации образования, согласно которой здоровье детей рассматривается как приоритетная ценность...
73452. Мокьюментари как особый вид киноискусства (на материале фильмов «Первые на луне», «Ноги – атавизм») 127 KB
  На современном этапе развития киноискусства особое внимание уделяется проблеме жанра в кино. Вследствие синтеза различных видов кинематографических произведений появляется большое количество смежных жанров использующих приемы сразу нескольких типов кино.
73454. Государственное управление защитой населения от катастроф природного и техногенного характера 124 KB
  Целью данной работы как раз и является исследование системы управления защитой населения в чрезвычайных ситуациях с её недостатками и достоинствами дача оценки работе МЧС в конкретных случаях.
73456. Современное состояние автоматизированных банковских систем в России 121.5 KB
  В соответствии с этим очевидна необходимость обладания современной автоматизированной банковской системой (АБС), позволяющей эффективно обрабатывать все возрастающие информационные потоки, а также непосредственно осуществлять операции на каждом этапе создания банковского продукта.
73457. Основные способы передачи звукоподражательной лексики на язык перевода 120 KB
  Звукоподражанием в морфологии принято считать неизменяемые слова воспроизводящие звуки издаваемые живыми существами механизмами или характерные для явлений окружающей среды хаха кваква и т. Систему звукоизобразительной лексики можно условно поделить на три группы...
73458. МЕТОДИКО–ПРАКТИЧЕСКОЕ ИССЛЕДОВАНИЕ ОРГАНИЗАЦИИ ТВОРЧЕСКИХ ИНДУСТРИЙ В ПРОСТРАНСТВЕ СОВРЕМЕННОГО ГОРОДА 116 KB
  Наверно каждый город может похвастаться своими местными культурными мероприятиями которые проходят в рамках одного города или региона. Данный фестиваль проводится в разных городах России и в каждом городе проводится по своему.