6506

Регрессионный анализ

Лабораторная работа

Математика и математический анализ

Регрессионный анализ Исходные данные Пусть y-случайная переменная, x-неслучайная переменная. - выборка значений (xy), полученная в эксперименте. xi- количество населения в миллионах, yi- число городов в России соответствующие данно...

Русский

2013-01-04

40.01 KB

10 чел.

Регрессионный анализ

Исходные данные

Пусть y-случайная переменная, x-неслучайная переменная. – выборка значений (x;y), полученная в эксперименте. xi - количество населения в миллионах, yi - число городов в России соответствующие данному количеству населения (таблица 1).

Таблица 1.

x

y

1

111

15

2

120

10

3

140

7

4

155

5

5

170

6

6

180

5

7

190

5

8

200

3

9

220

5

10

250

2

11

270

3

12

280

3

13

300

3

14

310

4

15

330

4

16

350

2

17

400

1

18

500

1

19

550

2

20

600

3

Объём выборки составляет n=20.

На рисунке 1 представлена зависимость числа городов от количества населения.

Рис. 1. Зависимость городов России от числа жителей

Построение модели зависимости

Построим модель зависимости между переменными x и y методом наименьших квадратов. Предположим, что зависимость между переменными линейная. Т.е. строится модель вида:

По выборочным данным найдём b0 и b1.

Решая систему методом Крамера, из составленных определителей получаем:

В полученные выражения введём выборочные моменты:

Тогда формулы для вычисления b0 и b1 примут вид:

Откуда b1 = -0.0152 и b0 = 8.726. Таким образом, получаем модель, которая представлена на рисунке 2 уравнением y = -0.0152x+8.726.

Рис. 2. Модель зависимости числа городов от населения

Оценки разброса или точности измерений дисперсий коэффициентов b0 и b1:

Проверка значимости коэффициентов регрессии

Проверка значимости коэффициентов регрессии сводится к последовательной проверке гипотез вида:

1) H0: β0 = 0  H1: β0 0     

2) H0: β1 = 0  H1: β1 0     

Для проверки этих гипотез вычисляются две выборочные статистики:

 

C11 и С22 – диагональные элементы информационной матрицы.

По таблице критических точек распределения Стьюдента, по уровню значимости α = 0.05 и числу степеней свободы k = 20-2=18 находим критическую точку tкр = 2.10.

Поскольку выполняется неравенство tкр<t, то можно говорить, что второй параметр модели не равен нулю.

Оценка корреляции

Через второй выборочный момент имеем:

r(b0, b1) отрицательный, близкий к -1, следовательно, параметры сильно взаимосвязаны друг с другом.

Доверительные интервалы

Зная коэффициент t = 2.10 при α = 0.05 и n = 20, находим:

Проверка адекватности модели Фишера

Проверим адекватность модели по критерию Фишера.

Найдём

где  =   =

где  = 6.04 xi + 6.86 ,  

Видно, что модель адекватна, т.к. <.

По таблице критических точек распределения Фишера, по уровню значимости α = 0.05 и числам степеней свободы k1 = 20-1=19 и k2 = 20-1=19 находим критическую точку Fкр = 2.1555.

Имеем, Fкр > Fнабл , следовательно, выдвинутая гипотеза о соответствии выборочных данных построенной модели принимается.

Исследование остатков

Проведём проверку остатков на нормальность при помощи критерия, основанного на анализе показателей асимметрии и эксцесса.

Вычисляем выборочные характеристики асимметрии и эксцесса:

Определяем среднеквадратические отклонения выборочных асимметрии и эксцесса:

Гипотеза о нормальности закона не отвергается.


 

А также другие работы, которые могут Вас заинтересовать

15778. Выбор средней величины в экономических расчётах 15.6 KB
  Выбор средней величины в экономических расчётах. В экономических расчётах наиболее часто используют средние арифметические и средние гармонические. Выбор того или иного вида средней зависит от исходных данных и исходного отношения – логической словесной формулы сре
15779. Вычисление среднеквадратического отклонения и дисперсии по преобразованной формуле 25.06 KB
  Вычисление среднеквадратического отклонения и дисперсии по преобразованной формуле. Среднее квадратичное отклонение определяет на сколько в среднем отклоняются конкретные варианты от их среднего значения и к тому же является абсолютной мерой колеблемости приз
15780. Индекс товарооборота фактических ценах 14.99 KB
  Индекс товарооборота фактических ценах Общий индекс товарооборота стоимости реализованных товаров: где p1q1 – товарооборот отчётного периода; р0q0 – товарооборот базисного периода. Знак означает что суммируются стоимости различных товаров. Количество с
15781. Индекс физического объёма товарооборота 15.02 KB
  Индекс физического объёма товарооборота также может быть построен по двум схемам: В этих индексах индексируемой величиной является количество товара q а весами цены базисного p0 или отчётного p1 периода. Индекс физического объёма това
15782. Индексы переменного состава, постоянного состава, структурных сдвигов 14.19 KB
  Индексы переменного состава постоянного состава структурных сдвигов. Индекс переменного состава показывает динамику среднего показателя как за счет применения индексируемой величины так и за счет изменения весов по которым взвешивается средняя т.е. влияние обоих ...
15783. Индивидуальные индексы и их свойства 39.33 KB
  Индивидуальные индексы и их свойства. Индивидуальные индексы рассчитываются для однородных совокупностей. Они представляют собой отношение уровня экономического явления в отчётном периоде к его уровню в базисном периоде. В общем виде этот индекс может быть записан в в...
15784. Компоненты уровня ряда динамики 11.64 KB
  Компоненты уровня ряда динамики. Ряд динамики может быть подвержен влиянию факторов эволюционного и осциллятивного характера а также находиться под влиянием факторов разного воздействия. Такие изменения динамического ряда называются тенденцией развития или трендо
15785. Анализ транспортной сети и грузоперевозок 156.5 KB
  Главной задачей транспорта является своевременное, качественное и полное удовлетворение потребностей народного хозяйства и населения в перевозках. Эффективность организации транспортного процесса и управление им
15786. Мода и медиана. Способы вычисления 30.08 KB
  Мода и медиана. Способы вычисления При изучении вариации применяются и такие характеристики вариационного ряда которые описывают количественную его структуру. Таковы медиана и мода. Медиана – это значение признака делящее пополам ранжированный упорядоченный вари