10975

Анализ точности определения оценок коэффициентов регрессии

Лекция

Математика и математический анализ

Анализ точности определения оценок коэффициентов регрессии В силу случайного отбора элементов данных в выборку случайными являются также оценки и коэффициентов и теоретического уравнения регрессии. Их математические ожидания при выполнении предпосылок об отклон

Русский

2013-04-03

69.28 KB

35 чел.

Анализ точности определения оценок коэффициентов регрессии

В силу случайного отбора элементов данных в выборку, случайными являются также оценки  и коэффициентов и теоретического уравнения регрессии. Их математические ожидания при выполнении предпосылок об отклонении  равны соответственно . При этом оценки тем надежнее, чем меньше их разброс вокруг  и , т.е. чем меньше дисперсии  и  оценок. Очевидно, надежность полученных оценок тесно связана с дисперсией случайных отклонений . Фактически ] является дисперсией  переменной  относительно линии регрессии (дисперсией , очищенной от влияния X). Полагая все измерения равноточными, считаем, что все эти дисперсии равны между собой .

Покажем связь дисперсий коэффициентов  и  с дисперсией случайных отклонений . С этой целью представим зависимости коэффициентов  и  (формулы (11.7) и (11.8)) в виде линейных функций относительно значений зависимой переменной :

Так как   , и введя обозначение 

окончательно получим:

Аналогично:

Обозначим    , тогда окончательно получим:

Полагая, что дисперсия  постоянная и не зависит от значений , можно рассматривать  и  как некоторые постоянные. Следовательно,

Из (12.3) и (12.4) можно сделать ряд выводов.

  1.  Дисперсии  и  прямо пропорциональны дисперсии случайного отклонения .
  2.  Чем больше дисперсия независимой (объясняющей) переменной (разброс значений ), тем меньше дисперсия оценок коэффициентов.

Ввиду того, что случайные отклонения  по выборке определены быть не могут, при анализе надежности оценок коэффициентов регрессии они заменяются отклонениями  значений  переменной  от оцененной линии регрессии. Дисперсия случайных отклонений  заменяется ее несмещенной оценкой.

Тогда

В этих выражениях  – необъясненная дисперсия (мера разброса зависимой переменной относительно линии регрессии). Корень квадратный из необъясненной дисперсии, т.е. , называется стандартной ошибкой оценки (стандартной ошибкой регрессии). Стандартные отклонения случайных величин  и  называются стандартными ошибками коэффициентов регрессии.

Проверка гипотез относительно коэффициентов линейной регрессии

Эмпирическое уравнение регрессии определяется на основе конечного числа статистических данных. Поэтому коэффициенты эмпирического уравнения регрессии являются СВ, изменяющимися от выборки к выборке. При проведении статистического анализа перед исследователем зачастую возникает необходимость сравнения эмпирических коэффициентов регрессии  и  с некоторыми теоретически ожидаемыми значениями и этих коэффициентов.

Данный анализ производится в рамках статистической проверки параметрических гипотез.

Показано, что в предположении нормальности распределения  при данном значении , оценки  и являются несмещенными оценками и соответственно. Их выборочные распределения связаны с
распределением (Стьюдента), которое имеет  степени свободы.

На первом этапе анализа наиболее важной является задача установления линейной зависимости между переменными  и . С этой целью сформулируем гипотезы:

линейная зависимость отсутствует, коэффициент угла наклона прямой незначимо отличается от нуля;

линейная зависимость значительная и коэффициент угла наклона не равен нулю.

При проверке гипотезы воспользуемся  статистикой:

Аналогичным образом проверяется гипотеза о статистической значимости нулю коэффициента регрессии  (свободный член линейного уравнения равен нулю):

Интервальные оценки коэффициентов линейной регрессии

Как указывалось выше, коэффициенты регрессии  и являются нормально распределенными СВ, с соответствующими дисперсиями, т.е. . Тогда следующие статистики

имеют распределение Стьюдента с числом степеней свободы . Тогда, для построения доверительного интервала с заданной доверительной вероятностью  найдем по статистическим таблицам критические значения:

С учетом (12.10) получим:

Если разрешить неравенства в формулах (12.12) относительно неизвестных коэффициентов регрессии  и  то получим соответствующие доверительные интервалы

Которые с доверительной вероятностью  накрывают определяемые параметры (теоретические коэффициенты регрессии).

Особый интерес представляет выборочное распределение  при конкретном значении . Так как  ведет себя как СВ, распределенная по нормальному закону, для нее тоже можно построить доверительный интервал. Соответствующая статистика имеет вид:

В выражении (12.14) величина это выборочное стандартное отклонение наблюденного значения от предсказанного , равное

.  (12.15)

Т.о. формулы (12.13 – 12.15) дают возможность построить доверительные интервалы для неизвестных параметров ,  и , по оценкам  и .

Пример 1.  ЛИНЕЙНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ

Имеется, выборка пар чисел рост студента (сантиметры), вес (масса) (килограммы).

Задание:

  1.  Определим прямую регрессию, задающую линейный прогноз средней массы студента по его росту.
  2.  Найдем также 95% доверительный интервал для средней массы студентов, имеющих рост 178 см.

Решение

По формуле (11.8) вычислим

.

По формуле (11.7) находим  .

Т.о. прямая регрессии, оценивающая среднюю массу студента по его росту, имеет вид:

Отсюда, для роста получим . Теперь для построения доверительного интервала для средней массы по оценке  вычислим

.

Теперь по формуле (12.14) Вычислим 95% доверительный интервал:


 

А также другие работы, которые могут Вас заинтересовать

59908. Визитная карточка классного руководителя 52.5 KB
  На сцену по одному из макета школы выходят дети и представляют себя Лентяй: Вот так бы и сидел весь день И встать бы не решился Сегодня лучший друг мой лень Я с ней давно сдружился.
59909. Вища математика. Завдання та методичні вказівки до виконання контрольної роботи 1.56 MB
  Виробнича ділянка Час на виготовлення одиниці продукції год. Виробничі потужності год. 2 Виробнича ділянка Час на виготовлення одиниці продукції год. Виробничі потужності год.
59911. Внеклассное мероприятие: Чаем угощаем 46.5 KB
  Оборудование: самовар чайная посуда угощение к чаю. Подготовка: Дети разучивают чайные частушки русскую народную игру €œПросо; подбирают пословицы о русском гостеприимстве песни с именами людей.
59912. Внеклассное мероприятие «Дорожный марафон» 45 KB
  Учитель: Правил дорожных на свете немало Все бы их выучить нем не мешало. Какие это препятствия Дети: читают Загадочный знак Площадь ребусов Песенная остановка Наведём порядок на дороге Секрет Учитель: А помогать нам и вести к завершению марафона будет нам наш городок.
59913. «Армейский калейдоскоп» (сценарий на 23 февраля) 41.5 KB
  Ведущий 1: Февральский ветер ворошил страницы в календаре порядок наводя Потом он вдруг решил остановиться на дате 23 февраля Давным-давно был праздник установлен Что говорить традиция сильна Мальчишек поздравляем снова мы им желаем мира и добра.
59914. Seasons. The weather 44 KB
  Now I will divide you into two teams. The first team will includes the children who were born in winter and autumn. The second team will include the children who was born in summer and spring.
59915. Путешествие в мир растений. Внеклассное мероприятие для учащихся начальной школы 45.5 KB
  Предварительная подготовка: ученики экскурсоводы заранее составляют и рисуют кроссворд подбирают материал о комнатных растения имеющихся в саду подготавливают загадки для ребят распределяют роли.
59916. Внеклассное мероприятие. Викторина: Моё здоровье – в моих руках 40.5 KB
  Цели. формировать здоровый образ жизни; воспитывать общую культуру здоровья; развивать коммуникативные умения учащихся. Предварительная подготовительная работа. Подготовка вопросов викторины.