45493

Регрессионные модели

Доклад

Коммуникация, связь, радиоэлектроника и цифровые приборы

Линейная одномерная модель: y =0 1 x Ei = Yi 0 1 Xi i = 1n где n число снятых экспериментально точек. Ошибки всех точек i от 1 до n следует сложить. Найдем значение sigm по формуле: Если в интервал Yэ Yт Yэ попадает 67 точек и более то выдвинутая нами гипотеза принимается. Если требуется большая уверенность в результате то используют дополнительное условие: в интервал Yэ 2 Yт Yэ 2 должны попасть 95 экспериментальных точек.

Русский

2013-11-17

85.5 KB

1 чел.

Регрессионные модели

По степени информированности исследователя об объекте существует деление объектов на три типа "ящиков".

  •  Черный (ничего об объекте неизвестно).
  •  Серый (известна внешняя структура объекта, неизвестны количественные значения параметров).
  •  Белый (об объекте известно все).

Вход и выход можно наблюдать и измерять. Содержимое ящика неизвестно. Задача - построить модель, зная вход и выход, то есть определить содержимое ящика.

  1.  Исследователь вносит гипотезу о структуре "ящика". 

Рассматривая экспериментально полученные данные, предположим, что они подчиняются линейной гипотезе, то есть выход y зависит от входа x линейно. Тогда:
y =A1 x + A0

  1.  Определим неизвестные коэффициенты модели A0 и A1. 

a) Линейная одномерная модель:

y =A0+ A1 x 

Ei = Yi - A0 - A1 Xi,   i = 1,n      , где n - число снятых экспериментально точек.

Ei- ошибка между теоретическим значением функции (A0 + A1 x) и экспериментальным Y у точки i. Ошибки всех точек (i от 1 до n) следует сложить. Чтобы положительные ошибки не компенсировали в сумме отрицательные, каждую из ошибок возводят в квадрат и складывают их значения в суммарную уже одного знака. Данный метод поэтому называется Методом наименьших квадратов.

Таким образом, F - суммарная ошибка. F является функцией двух переменных A0 и A1, так как меняя эти величины можно влиять на величину ошибки. Естественно, что суммарную ошибку следует минимизировать . Для этого найдем производные от F по каждой переменной и приравняем их нулю.

Получим систему из двух уравнений

Надо найти коэффициенты A0 и A1, для этого решаем систему методом Крамера, построив предварительно определитель следующего вида:

  1.  Проверка. 

Чтобы определить, принимается гипотеза или нет, нужно рассчитать ошибку между теоретической и экспериментальной зависимостями.



Найдем значение "sigma" по формуле:

Если в интервал (Yэ - Yт Yэ + ) попадает 67% точек и более, то выдвинутая нами гипотеза принимается. В противном случае, выбирают более сложную гипотезу или проверяют исходные данные. Если требуется большая уверенность в результате, то используют дополнительное условие: в интервал (Yэ - 2 Yт Yэ +2 ) должны попасть 95% экспериментальных точек.

Условие принятия гипотезы выведено из нормального распределения случайных ошибок.

b) Множественная линейная модель.

Предположим, что функциональная структура "ящика" имеет линейную зависимость, но количество входных сигналов, действующих одновременно, равно m.
Y = A0+ A1X1 + ... + Am Xm

Так как мы имеем экспериментальные данные о всех входах и выходах "черного" ящика, то можно вычислить ошибку между теоретическим значением Y и экспериментальным:


Ei = Yi - A0- A1X1 - ... - Am Xm,
тогда суммарная ошибка будет

Ошибку минимизируем. Ошибка зависит от выбора параметров
A0 , A1 , ..., Am . Для нахождения экстремума приравняем все частные производные F по неизвестным A0 , A1 , ..., Am к нулю:

Получим систему из (m+1) уравнения с (m+1) неизвестной, которую следует решить для определения A0 , A1 , ..., Am . Для решения системы уравнений построим определители:

Вычисляем коэффициенты A0 , A1 , ..., Am .

Дальше вычисляется ошибка и находится по аналогии с одномерной моделью. К линейной множественной модели приводятся многие нелинейные модели подстановками и переобозначениями

  1.  Проведем эксперимент - возьмем несколько точек например так 

  1.  Далее выбираем гипотезу допустим, для нашего примера 

Возьмем линейную функцию y = a x + b 

  1.  Теперь запишем уранение ошибки эксперимента 

  1.  Далее необходимо найти все коэффициенты уравнения

Для нахождения экстремума приравняем частные производные

функции F по переменным а и b к нулю:

По имеющимся экспериментальным данным построим следующую таблицу:

i

Xi

Yi

Xi2 

XiYi

1

2

3

4

6

2

5

4

25

20

3

7

7

49

49

4

8

4

64

32

5

10

8

100

80

6

11

7

121

77

7

14

9

196

126

Далее из таблицы берем данные для построения определителя:

Решая систему уравнений:
5 b + 57 a = 42
57 b + 559 a = 390

получим следующие коэффициенты а и b:
a = 0.51; b = 1.84

Таким образом, мы получили следующее линейное уравнение:

y = 0.51 x + 1.84

  1.  И теперь определяем, принимается гипотеза или нет.

Для этого необходимо рассчитать ошибку между теоретической и экспериментальной зависимостью .

  1.  Далее нужно найти значение "" по формуле: = sqrt(F/n)
    Если в интервал (Y
    э- YT Yэ+) попадает 67% точек и более, то выдвинутая нами гипотеза принимается.

    Для нашего примера. 

E1= 0.14 =>E1 2= 0.02
E
2 = -0.39 => E22 = 0.15
E
3 = 1.59 =>E3 2= 2.53
E
4 = -1.92 => E4 2= 3.69
E
5 = 1.06 =>E52= 1.12
E
6 = -0.45 => E6 2= 0.203
E
7 = 0.02 =>E7 2= 0.0004 

Отсюда:

Исходя из полученных данных сделайте вывод.
Для нашего примера он будет звучать так:
проверив все экспериментальные точки на вхождение в интервал (Yэ-YT Yэ+), мы находим, что около 71.6% точек попали в sigma-интервал. Следовательно наша гипотеза о линейности верна.


 

А также другие работы, которые могут Вас заинтересовать

78253. Острая ревматическая лихорадка у детей 146 KB
  Рекомендации по изменению термина ревматизм на ОРЛ в последнем X пересмотре МКБ имеют определенную цель и логику так как в большей степени привлекают работников здравоохранения к инфекционному фактору который лежит в основе заболевания которое характеризуется преимущественным поражением сердца и сосудов. Хроническая ревматическая болезнь сердца это заболевание характеризующееся поражением сердечных клапанов в виде поствоспалительного краевого фиброза клапанных структур и порока сердца недостаточности или стеноза сформировавшихся...
78254. Ювенильный ревматоидный артрит у детей 156 KB
  В группу коллагеновых заболеваний входит значительное количество патологических состояний, общим признаком которых является системная прогрессирующая дезорганизация...
78255. Другие коллагенозы у детей 128.5 KB
  Изучение роли очаговой латентной инфекции при СКВ показало что ангины и хронический тонзиллит при этом заболевании встречаются не так уж часто а терапия антибиотиками не только уменьшала количество больных а наоборот нередко выявляла латентно протекающее заболевание....
78256. Неотложные состояния у детей 141.5 KB
  У детей, особенно первого года жизни, многие заболевания, такие как пневмония, вирусные, кишечные инфекции, сепсис, сахарный диабет часто сопровождаются нарушением микроциркуляции, обменных процессов, развитием тяжелой интоксикации с возникновением состояний
78257. Периоды детского возраста 91 KB
  Ребенок - это не взрослый в миниатюре, его организм обладает своеобразными анатомо-физиологическими, биохимическими и иммунологическими особенностями, претерпевающими характерные возрастные изменения в течение всего периода детства. Для дифференцированного подхода к ребенку все детство разделено на периоды.
78258. Естественное вскармливание 128 KB
  Рациональное питание отвечающее физиологическим потребностям растущего организма обеспечивает гармоничное развитие ребенка повышает его иммунитет выносливость при воздействии неблагоприятных факторов. Для обеспечения ребенка рациональным питанием в его рацион должны входить все основные пищевые вещества: белки жиры углеводы витамины минеральные вещества и вода в необходимом количестве и правильном соотношении. Органы пищеварения ребенка характеризуются незавершенностью морфологического строения и функционального состояния.
78259. Смешанное и искусственное вскармливание 197.5 KB
  Эти затруднения могут происходить как со стороны матери так и со стороны ребенка. Существуют абсолютные и относительные противопоказания к кормлению ребенка грудью. Установлено что ВИЧинфицированная женщина с вероятностью 15 заражает ребенка через грудное молоко поэтому в Российской Федерации ребенка рожденного от ВИЧинфицированной матери рекомендуется кормить адаптированными молочными смесями. Не должны кормить ребенка матери страдающие алкогольной и наркотической зависимостью.
78260. Дистрофии у детей 123 KB
  Строится с учетом происхождения типа степени тяжести и этиологии заболевания: По времени возникновения: врожденные дистрофии пренатальные приобретенные дистрофии постнатальные смешанного происхождения. В зависимости от соотношения массы и длины тела то есть по типу: гипотрофия 123 степени паратрофия. Выделяют 3 степени тяжести гипотрофии: 1 степень легкая 2 степень среднетяжелая 3 степень тяжелая. Клиническим выражением степени нарушений при дистрофии является состояние аппетита.
78261. Энзимопатии у детей 122.5 KB
  Это наследственная болезнь обмена тирозина характеризующаяся развитием дистрофии цирроза печени рахитоподобным изменением костей и поражением почечных канальцев. Острый тирозиноз развивается в первые дни жизни ребенка и проявляется рвотой поносом задержкой физического развития увеличением размеров печени и селезенки дыхательной недостаточностью. Кожные покровы постепенно приобретают желтушный оттенок развивается цирроз печени. Особенно тяжело повреждаются клетки центральной нервной системы печени почек развивается помутнение...