6506

Регрессионный анализ

Лабораторная работа

Математика и математический анализ

Регрессионный анализ Исходные данные Пусть y-случайная переменная, x-неслучайная переменная. - выборка значений (xy), полученная в эксперименте. xi- количество населения в миллионах, yi- число городов в России соответствующие данно...

Русский

2013-01-04

40.01 KB

10 чел.

Регрессионный анализ

Исходные данные

Пусть y-случайная переменная, x-неслучайная переменная. – выборка значений (x;y), полученная в эксперименте. xi - количество населения в миллионах, yi - число городов в России соответствующие данному количеству населения (таблица 1).

Таблица 1.

x

y

1

111

15

2

120

10

3

140

7

4

155

5

5

170

6

6

180

5

7

190

5

8

200

3

9

220

5

10

250

2

11

270

3

12

280

3

13

300

3

14

310

4

15

330

4

16

350

2

17

400

1

18

500

1

19

550

2

20

600

3

Объём выборки составляет n=20.

На рисунке 1 представлена зависимость числа городов от количества населения.

Рис. 1. Зависимость городов России от числа жителей

Построение модели зависимости

Построим модель зависимости между переменными x и y методом наименьших квадратов. Предположим, что зависимость между переменными линейная. Т.е. строится модель вида:

По выборочным данным найдём b0 и b1.

Решая систему методом Крамера, из составленных определителей получаем:

В полученные выражения введём выборочные моменты:

Тогда формулы для вычисления b0 и b1 примут вид:

Откуда b1 = -0.0152 и b0 = 8.726. Таким образом, получаем модель, которая представлена на рисунке 2 уравнением y = -0.0152x+8.726.

Рис. 2. Модель зависимости числа городов от населения

Оценки разброса или точности измерений дисперсий коэффициентов b0 и b1:

Проверка значимости коэффициентов регрессии

Проверка значимости коэффициентов регрессии сводится к последовательной проверке гипотез вида:

1) H0: β0 = 0  H1: β0 0     

2) H0: β1 = 0  H1: β1 0     

Для проверки этих гипотез вычисляются две выборочные статистики:

 

C11 и С22 – диагональные элементы информационной матрицы.

По таблице критических точек распределения Стьюдента, по уровню значимости α = 0.05 и числу степеней свободы k = 20-2=18 находим критическую точку tкр = 2.10.

Поскольку выполняется неравенство tкр<t, то можно говорить, что второй параметр модели не равен нулю.

Оценка корреляции

Через второй выборочный момент имеем:

r(b0, b1) отрицательный, близкий к -1, следовательно, параметры сильно взаимосвязаны друг с другом.

Доверительные интервалы

Зная коэффициент t = 2.10 при α = 0.05 и n = 20, находим:

Проверка адекватности модели Фишера

Проверим адекватность модели по критерию Фишера.

Найдём

где  =   =

где  = 6.04 xi + 6.86 ,  

Видно, что модель адекватна, т.к. <.

По таблице критических точек распределения Фишера, по уровню значимости α = 0.05 и числам степеней свободы k1 = 20-1=19 и k2 = 20-1=19 находим критическую точку Fкр = 2.1555.

Имеем, Fкр > Fнабл , следовательно, выдвинутая гипотеза о соответствии выборочных данных построенной модели принимается.

Исследование остатков

Проведём проверку остатков на нормальность при помощи критерия, основанного на анализе показателей асимметрии и эксцесса.

Вычисляем выборочные характеристики асимметрии и эксцесса:

Определяем среднеквадратические отклонения выборочных асимметрии и эксцесса:

Гипотеза о нормальности закона не отвергается.


 

А также другие работы, которые могут Вас заинтересовать

50675. Функции системы MATLAB 108 KB
  Изучение основных функций системы MATLAB. Создание новых функций и построение их графиков в среде MATLAB. Решение систем линейных уравнений. Изучение генератора базовой случайной величины.
50676. Изучение методов структурного резервирования 95.5 KB
  Требуется с помощью различных видов резервирования обеспечить надежность системы в течении T = 1000 часов c вероятностью безотказной работы не менее Pдоп = 0.95 задавая кратность резервирования определяя её стоимость. Необходимо определить какой тип резервирования наиболее эффективен.
50678. Определение теплоёмкости металлов методом охлаждения 91 KB
  В данной работе мы измеряли теплоёмкость трёх элементов: меди алюминия и стали. Изначально мы предполагали что максимальная теплоёмкость у стали а минимальная у алюминия моё предположение основывалось на зависимости теплоёмкости от плотности это оказалось не верно. После проведения эксперимента выяснилось что максимальная теплоёмкость у алюминия091001 Дж гК а минимальная у меди ССu = 0.