2298

Математична обробка даних експерименту. Парна регресія

Лекция

Математика и математический анализ

Постановка задачі. Парна регресія. Лінійна парна регресія. Лінеаризація деяких видів двопараметричних зв’язків. Метод найменших квадратів (МНК). Алгоритм МНК. Приклад розв’язування задачі в середовищі системи Mathcad.

Украинкский

2013-01-06

74.68 KB

72 чел.

Лекція 13. Математична обробка даних експерименту. Парна регресія

План

1. Постановка задачі. Парна регресія.

2. Лінійна парна регресія.

3. Лінеаризація деяких видів двопараметричних зв’язків.

4. Метод найменших квадратів (МНК).

5. Алгоритм МНК.

6. Приклад розв’язування задачі в середовищі системи Mathcad.

1. Постановка задачі. Парна регресія

В практичній діяльності при проведенні досліджень виникає необхідність в математичній обробці результатів експерименту. Для цього використовують кореляційний та регресійний аналіз.

Кореляція (співвідношення, відповідність) – залежність між явищами або величинами, що не мають чіткого функціонального зв’язку.

Регресія (повернення) – ймовірнісна залежність середнього значення якоїсь величини від іншої величини.

При застосуванні регресійного аналізу можна використовувати два види регресій:

  1.  парна регресія – характеризує взаємозв’язок двох множин {xi} та {yi}, тобто одному значенню множини {yi} відповідає тільки одне значення множини {xi};
  2.  множинна регресія – характеризує взаємозв’язок більш, ніж двох множин, тобто одному значенню множини {yi} може відповідати два і більше значень множин {xi(k)}.

Розглянемо парну регресійну залежність результатів експерименту (таблиця 1)

 Результати експерименту

      Таблиця 1

X

x1

x2

x3

xn

Y

y1

y2

y3

yn

Нехай змінні множин X та Y зв’язані між собою деякою функціональною залежністю

y=f(a,b,x). (1)

Якщо на координатній площині x0y відкласти точки з координатами (xi, yi), то отримаємо поле розсіювання, яке може дати наочне представлення про силу тісноти зв’язку та його тип (прямолінійний чи криволінійний) між X та Y.

Математична обробка експериментальних даних (таблиця 1) з допомогою кореляційного та регресійного аналізу проводиться за таким алгоритмом:

1) будують поле розсіювання (на координатній площині x0y відкладають точки з координатами (xi, yi) і з’єднують їх ламаною лінією);

2) вибирають емпіричну формулу (1) користуючись виглядом ламаної лінії;

3) при необхідності лінеаризують формулу (1);

4) визначають параметри a і b формули (1);

5) аналізують результати експерименту.

2. Лінійна парна регресія

Найпростішою залежністю між двома послідовностями є лінійна парна регресія. У цьому випадку рівняння регресії матиме вигляд   (2)

Про тісноту зв’язку між множинами X та Y може свідчити коефіцієнт кореляції r, який приймає значення з інтервалу [-1; 1]:

1)  – зв’язок відсутній;

2) – зв’язок слабкий;

3)  – зв’язок середній;

4)  – зв’язок сильний;

5)  – зв’язок повний.

Якщо , то зв’язок між множинами X та Y прямий, тобто при зростанні X зростають Y; якщо , то зв’язок між множинами X та Y обернений, тобто при зростанні X спадають Y.

3. Лінеаризація деяких видів двопараметричних зв’язків

На практиці дуже часто зв’язок між множинами X та Y носить нелінійний (криволінійний) характер. У більшості випадків за допомогою простих перетворень можна звести нелінійну залежність до лінійної, тобто провести лінеаризацію. Наведемо приклади лінеаризації найбільш часто вживаних нелінійних функцій (табл. 2).

         Таблиця 2

з/п

Функція

Лінеаризуючі перетворення

перетворення змінних

вирази для

коефіцієнтів

y=f(a,b,x)

1

2

3

4

5

6

4. Метод найменших квадратів (МНК)

Лінійний парний регресійний аналіз полягає у визначенні параметрів a і b емпіричної лінійної функції (2), яка описує зв’язок між деяким числом N пар значень (xi, yi) і забезпечує найменшу середньоквадратичну похибку.

Графічно цю задачу можна представити так: у полі розсіювання точок (xi, yi) площини x0y необхідно провести пряму так, щоб величина всіх відхилень задовольняла умову

(3)

Тому цей метод регресійного аналізу називається методом найменших квадратів (МНК).

Для знаходження коефіцієнтів a і b рівняння регресії (2) необхідно знайти часткові похідні по a і b від функції (3) і прирівняти їх до нуля:

(4)

Після простих перетворень отримаємо систему нормальних рівнянь

(5)

Коли розв’яжемо систему (5), то отримаємо коефіцієнти a і b рівняння регресії (2).

Зауваження. На практиці коефіцієнти a і b частіше знаходять з використанням коефіцієнтів кореляції та коваріації.

5. Алгоритм МНК

Алгоритм МНК складається з дев’яти етапів:

  1.  знаходимо середні значення масивів X та Y:
  2.  знаходимо середньоквадратичні вибіркові відхилення:

  1.  знаходимо коефіцієнт коваріації:

  1.  знаходимо коефіцієнт кореляції:

  1.  знаходимо коефіцієнти рівняння регресії:

  1.  знаходимо теоретичні значення змінної Y:

  1.  знаходимо середньоквадратичне відхилення між експери-менттальними та теоретичними значеннями змінної Y:

  1.  знаходимо рівняння ліній смуги довір’я:

  1.  знаходимо інтервал смуги довіря:  

6. Приклад розв’язування задачі в середовищі Mathcad

В таблицю занесені дані експерименту:

x

0

1

2

3

4

5

6

y

4.1

2.4

3

4.3

3.6

5.2

5.9

Побудувати апроксимаційний поліном 1-го степеня . Побудувати в одному графічному вікні графіки заданої дискретної функції і графік отриманої функції .

Завдання виконати в середовищі MathCad.

Розв’язання

 Функції MathCad, які використовуються при розрахунках лінійної регресії:

  1.  line(x,y)вектор із двох елементів (b,a) коефіцієнтів рівняння лінійної регресії
  2.  intercept(x,y) – коефіцієнт b рівняння лінійної регресії
  3.  slope(x,y) - коефіцієнт a рівняння лінійної регресії

Тут x –вектор дійсних даних аргументу, y – вектор дійсних даних функції того ж розміру.

В системі MathCad є два дублюючих один одного способи для розрахунку лінійної регресії.

1-й спосіб.

Рівняння лінійної регресії 

має такий вид:

y=0.414x+2.829

2-й спосіб.

Рівняння лінійної регресії 

має такий вид:

y=0.414x+2.829


 

А также другие работы, которые могут Вас заинтересовать

422. Построение эмпирических формул методом наименьших квадратов 575.5 KB
  Нахождение эмпирических формул методом наименьших квадратов (МНК) посредством возможностей пакета Microsoft Excel, Mathcad, MATLAB. Уравнения различных видов с помощью аппроксимации линейной, квадратичной и экспоненциальной зависимостей.
423. Привод к роликовому конвейеру 4.24 MB
  Выбор электродвигателя и кинематический расчет привода. Предварительный расчет валов редуктора и выбор подшипников. Проверка прочности шпоночных соединений. Конструирование корпуса редуктора.
424. Философское учение о ценностях (аксиология) 164.5 KB
  В качестве философской категории ценность — то, что чувства людей диктуют признать стоящим над всем и к чему можно стремиться, созерцать, относиться с уважением, признанием, почтением. Жизненные ценности: их роль в воспитательной деятельности. Типы ценностного сознания в истории культуры.
425. Использование стекла в архитектуре 79 KB
  Сырьем для производства обычного стекла служит главным образом оксид кремния (71-73%), или, иначе говоря, обычный песок. Оксиды магния и алюминия выполняют стабилизирующую функцию, повышая прочность стекла.
426. Финансовые институты. Биржа как финансовый институт 136 KB
  Банки, их виды и функции. Совокупность кредитно-финансовых учреждений, аккумулирующих и предоставляющих в долг денежные средства. Биржа как финансовый институт, её роль и функции. Прочие финансовые институты, их роль в организации финансового обращения.
427. Общепринятые теории происхождения жизни на планете Земля 83.5 KB
  Теории происхождения жизни на Земле. Абиогенная теория происхождения жизни на Земле. Поиск жизни во Вселенной. Вероятность самозарождения живого организма из неорганических веществ практически равняется нулю.
428. Вибір стратегічного профілю зовнішньоекономічної діяльності 132 KB
  Нині у практиці міжнародного бізнесу сформувалося чотири основних стратегічних профілі міжнародних компаній, з урахуванням яких доцільно виробляти основні стратегічні рішення. Процес формування, оцінювання і прийняття стратегій розвитку бізнесу.
429. Разработка программы Каталогизатор дисков 605.5 KB
  В данной пояснительной записке рассматривается описание программы Dark Catalog. В качестве основного инструмента разработки применяется Microsoft Visual Studio 2005. Язык программирования C#.
430. Нормирование труда и использование рабочего времени на предприятии 287.5 KB
  Изучение методов нормирования труда и использования рабочего времени и разработка рекомендаций по их совершенствованию. Анализ нормирования труда и использования рабочего времени на примере ОАО КЭМЗ. Методы определения экономической эффективности мероприятий по совершенствованию организации и нормированию труда.