10975

Анализ точности определения оценок коэффициентов регрессии

Лекция

Математика и математический анализ

Анализ точности определения оценок коэффициентов регрессии В силу случайного отбора элементов данных в выборку случайными являются также оценки и коэффициентов и теоретического уравнения регрессии. Их математические ожидания при выполнении предпосылок об отклон

Русский

2013-04-03

69.28 KB

36 чел.

Анализ точности определения оценок коэффициентов регрессии

В силу случайного отбора элементов данных в выборку, случайными являются также оценки  и коэффициентов и теоретического уравнения регрессии. Их математические ожидания при выполнении предпосылок об отклонении  равны соответственно . При этом оценки тем надежнее, чем меньше их разброс вокруг  и , т.е. чем меньше дисперсии  и  оценок. Очевидно, надежность полученных оценок тесно связана с дисперсией случайных отклонений . Фактически ] является дисперсией  переменной  относительно линии регрессии (дисперсией , очищенной от влияния X). Полагая все измерения равноточными, считаем, что все эти дисперсии равны между собой .

Покажем связь дисперсий коэффициентов  и  с дисперсией случайных отклонений . С этой целью представим зависимости коэффициентов  и  (формулы (11.7) и (11.8)) в виде линейных функций относительно значений зависимой переменной :

Так как   , и введя обозначение 

окончательно получим:

Аналогично:

Обозначим    , тогда окончательно получим:

Полагая, что дисперсия  постоянная и не зависит от значений , можно рассматривать  и  как некоторые постоянные. Следовательно,

Из (12.3) и (12.4) можно сделать ряд выводов.

  1.  Дисперсии  и  прямо пропорциональны дисперсии случайного отклонения .
  2.  Чем больше дисперсия независимой (объясняющей) переменной (разброс значений ), тем меньше дисперсия оценок коэффициентов.

Ввиду того, что случайные отклонения  по выборке определены быть не могут, при анализе надежности оценок коэффициентов регрессии они заменяются отклонениями  значений  переменной  от оцененной линии регрессии. Дисперсия случайных отклонений  заменяется ее несмещенной оценкой.

Тогда

В этих выражениях  – необъясненная дисперсия (мера разброса зависимой переменной относительно линии регрессии). Корень квадратный из необъясненной дисперсии, т.е. , называется стандартной ошибкой оценки (стандартной ошибкой регрессии). Стандартные отклонения случайных величин  и  называются стандартными ошибками коэффициентов регрессии.

Проверка гипотез относительно коэффициентов линейной регрессии

Эмпирическое уравнение регрессии определяется на основе конечного числа статистических данных. Поэтому коэффициенты эмпирического уравнения регрессии являются СВ, изменяющимися от выборки к выборке. При проведении статистического анализа перед исследователем зачастую возникает необходимость сравнения эмпирических коэффициентов регрессии  и  с некоторыми теоретически ожидаемыми значениями и этих коэффициентов.

Данный анализ производится в рамках статистической проверки параметрических гипотез.

Показано, что в предположении нормальности распределения  при данном значении , оценки  и являются несмещенными оценками и соответственно. Их выборочные распределения связаны с
распределением (Стьюдента), которое имеет  степени свободы.

На первом этапе анализа наиболее важной является задача установления линейной зависимости между переменными  и . С этой целью сформулируем гипотезы:

линейная зависимость отсутствует, коэффициент угла наклона прямой незначимо отличается от нуля;

линейная зависимость значительная и коэффициент угла наклона не равен нулю.

При проверке гипотезы воспользуемся  статистикой:

Аналогичным образом проверяется гипотеза о статистической значимости нулю коэффициента регрессии  (свободный член линейного уравнения равен нулю):

Интервальные оценки коэффициентов линейной регрессии

Как указывалось выше, коэффициенты регрессии  и являются нормально распределенными СВ, с соответствующими дисперсиями, т.е. . Тогда следующие статистики

имеют распределение Стьюдента с числом степеней свободы . Тогда, для построения доверительного интервала с заданной доверительной вероятностью  найдем по статистическим таблицам критические значения:

С учетом (12.10) получим:

Если разрешить неравенства в формулах (12.12) относительно неизвестных коэффициентов регрессии  и  то получим соответствующие доверительные интервалы

Которые с доверительной вероятностью  накрывают определяемые параметры (теоретические коэффициенты регрессии).

Особый интерес представляет выборочное распределение  при конкретном значении . Так как  ведет себя как СВ, распределенная по нормальному закону, для нее тоже можно построить доверительный интервал. Соответствующая статистика имеет вид:

В выражении (12.14) величина это выборочное стандартное отклонение наблюденного значения от предсказанного , равное

.  (12.15)

Т.о. формулы (12.13 – 12.15) дают возможность построить доверительные интервалы для неизвестных параметров ,  и , по оценкам  и .

Пример 1.  ЛИНЕЙНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ

Имеется, выборка пар чисел рост студента (сантиметры), вес (масса) (килограммы).

Задание:

  1.  Определим прямую регрессию, задающую линейный прогноз средней массы студента по его росту.
  2.  Найдем также 95% доверительный интервал для средней массы студентов, имеющих рост 178 см.

Решение

По формуле (11.8) вычислим

.

По формуле (11.7) находим  .

Т.о. прямая регрессии, оценивающая среднюю массу студента по его росту, имеет вид:

Отсюда, для роста получим . Теперь для построения доверительного интервала для средней массы по оценке  вычислим

.

Теперь по формуле (12.14) Вычислим 95% доверительный интервал:


 

А также другие работы, которые могут Вас заинтересовать

69375. ПРОГРАМУВАННЯ МІКРОПРОЦЕСОРНИХ СИСТЕМ НА БАЗІ МІКРОКОНТРОЛЕРІВ РОДИНИ МК-51 822 KB
  Більшу частину команд даної групи (таблиця 1) складають команди передачі та обміну байтами. Команди пересилки входять і в групу команд роботи з окремими бітами. Всі команди даної групи не модифікують прапорці результату, за винятком команд завантаження PSW...
69376. ОСОБЛИВОСТІ АРХІТЕКТУРИ ОКРЕМИХ ФУНКЦІОНАЛЬНИХ МОДУЛІВ МІКРОКОНТРОЛЕРА 996 KB
  Схема інкременту призначена: для збільшення на 1 у кожному машинному циклі вмісту регістрів T C0 T C1 для яких встановлений режим таймера і дозволена лічба; для збільшення на 1 вмісту регістрів T C0 T C1 для яких встановлений режим лічильника зовнішніх подій дозволена...
69377. Архітектура паралельних портів та підсистема переривань 910.5 KB
  Існує два способи обміну даними між зовнішніми пристроями (ЗВПР) і мікропроцесорною системою (МПС): паралельний, коли одночасно передаються всі біти або декілька біт слова даних; послідовний, коли біти слова даних пересилаються по черзі, починаючи, наприклад, з його молодшого розряду.
69378. Архітектура послідовних портів 1.23 MB
  Існує два способи обміну даними між зовнішніми пристроями ЗВПР і мікропроцесорною системою МПС: паралельний коли одночасно передаються всі біти або декілька біт слова даних; послідовний коли біти слова даних пересилаються по черзі починаючи наприклад з його молодшого розряду.
69379. Організація пам’яті Мікроконтролерів родини МК-51 999.5 KB
  Місце модуля памяті у структурі мікроконтролера Призначення та місце модуля памяті у мікропроцесорних системах При вивченні модульної структури мікропроцесорної системи МПС відзначалося що одним з основних її модулів є...
69380. ТАКТУВАННЯ, РЕЖИМИ ЗНИЖЕНОГО ЕНЕРГОСПОЖИВАННЯ ТА СКИДАННЯ 560.5 KB
  Блок керування та синхронізації мікропроцесора Блок керування та синхронізації призначений для формування синхронізуючих і керуючих сигналів які забезпечують координацію спільної роботи блоків МКра у всіх допустимих режимах роботи.
69381. Особливості архітектури типового мікроконтролера родини МК-51 2.36 MB
  Структура типового МК (мікроконтролера) родини МК-51 (рисунок 1) містить: арифметико-логічний пристрій (АЛП); регістри тимчасового збереження операндів (програмно недоступні, на структурі МК позначені Т1, Т2); один з основних регістрів – акумулятор, на структурі МК позначений А...
69382. Особливості розробки робочої керуючої програми та програмна модель мікроконтролера 302 KB
  РПД являє собою 128 восьмирозрядних регістрів які призначені для прийому збереження та видачі різноманітної інформації. Шістнадцять із цих регістрів допускають побітову адресацію. В області молодших адрес РПД знаходяться 4 банки регістрів загального призначення РЗП кожен...
69383. ХАРАКТЕРИСТИКА КОМАНД МІКРОКОНТРОЛЕРА 208 KB
  Мнемоніка команди представлення коду операції у вигляді сполучення латинських літер що мають визначений зміст використовуються англійські слова або скорочення наприклад MOV PUSH POP JMP CLR NOP. Мнемокод включає в себе мнемоніку команди та опис операндів які беруть участь в операції.