18397

СТАТИСТИЧНІ МЕТОДИ ВИМІРЮВАННЯ ВЗАЄМОЗВЯЗКІВ

Лекция

Социология, социальная работа и статистика

ТЕМА 8. СТАТИСТИЧНІ МЕТОДИ ВИМІРЮВАННЯ ВЗАЄМОЗВ€ЯЗКІВ. 8.1. Види взаємозв язків між явищами 8.2. Метод аналітичного групування. 8.3. Основи кореляційнорегресійного аналізу. 8.4. Множинна регресія. 8. 1. Види взаємозв язків між явищами. Всі явища суспільного життя іс

Украинкский

2013-07-08

487 KB

27 чел.

ТЕМА 8. СТАТИСТИЧНІ МЕТОДИ ВИМІРЮВАННЯ ВЗАЄМОЗВ”ЯЗКІВ.

8.1. Види взаємозв язків між явищами

8.2. Метод аналітичного групування.

8.3. Основи кореляційно-регресійного аналізу.

8.4. Множинна регресія.

8. 1. Види взаємозв язків між явищами.

Всі явища суспільного життя існують не ізольовано, а у нерозривному взаємозв”язку, тобто залежать одне від одного. Вивчення взаємозв”язків та вимірювання причинних залежностей- найважливіше завдання статистики. Причинна залежність - головна форма закономірних зв”язків. Проте сама причина повною мірою не визначає наслідку.Наслідок  також залежить і від умов, у яких діє причина, тобто від факторів. Тому для виникнення наслідку необхідні і причини і умови (фактори).

Ознака, яка характеризує наслідок - результативна.

Ознака, яка характеризує фактор – факторна.

За статистичною природою зв”язки бувають:

а) функціональні;

б) стохастичні.

При функціональнім зв”язку кожному можливому значенню факторної ознаки х відповідає чітко визначене значення результативної ознаки у. Тобто функціональні зв”язки характеризуються повною відповідністю між  причиною і наслідком, факторною та результативною ознаками (фізичні та хімічні явища; складові елементи розрахункових формул у суспільних явищах: урожайність дорівнює валовому збору, поділеному на площу або формула шляху як добуток швидкості руху та часу).

ППри стохастичнім зв”язку кожному значенню ознаки х відповідає певна множина значень ознаки у, які варіюють і утворюють ряд розподілу (умовний). Цей зв язок проявляється зміною умовних розподілів.

Розглянемо показники розвитку садівництва у 20 господарствах (табл. 1): урожайність насіння та косточкових плодів і їх виробництво на одного працівника (продуктивність праці) та розрахуємо комбінаційний розподіл господарств за двома ознаками (табл. 2)

Таблиця 1

Показники розвитку садівництва у 20 господарствах

Номер господарства

Урожайність насінневих та кісточкових плодів, ц/га

Витрати добрив на 100 га. Насінневих та кісточкових насаджень, тис. грн.

 

Виробництво насінневих та кісточкових плодів на одного працівника, ц

у

  1.  

50,3

1,5

203,1

  1.  

40,8

2,5

200,3

  1.  

55,0

3,3

242,7

  1.  

44,0

4,0

228,0

  1.  

67,7

5,7

308,5

  1.  

65,9

3,0

257,0

  1.  

79,6

2,9

308,6

  1.  

89,4

4,1

316,2

  1.  

72,3

4,5

280,1

  1.  

110,5

3,1

358,9

  1.  

120,0

6,2

360,6

  1.  

131,7

4,3

365,4

  1.  

92,8

7,1

340,8

  1.  

136,0

4,5

422,0

  1.  

97,0

5,3

365,0

  1.  

93,4

7,7

310,8

  1.  

178,3

7,2

420,0

  1.  

143,7

6,8

380,7

  1.  

165,4

5,4

425,4

  1.  

190,2

5,9

510,3

Таблиця 2

Комбінаційний розподіл 20 господарств за урожайністю та продуктивністю праці у садівництві

Групи господарств за врожайністю

ц/га

Кількість господарств за рівнем продуктивності праці, ц/особу.

Разом

до 270

270-320

320-370

370 і більше

До 70

5

1

-

-

6

70-140

-

4

5

1

10

Понад 140

-

-

-

4

4

Разом

5

5

5

5

20

Побудовану таким чином табл. 2 називають таблицею співзалежності. Кожен її рядок (крім підсумку) містить частоти розподілу господарств за рівнем виробництва плодів (ПП) при фіксованому значенні врожайності, тобто частоти умовного розподілу. Підсумковий рядок містить частоти безумовного розподілу. У даному випадку зв”язок між ознаками стахостичний, оскільки кожному значенню (інтервалу значень) ознаки х відповідає декілька значень ознаки у. Частоти у табл.2 розташовані по діогоналі: в першій групі з низьким рівнем урожайності (до 70 ц/га) переваджають господарства з низьким рівнем продуктивності праці, у третій групі (понад 140 ц/га) усі господарства мають продуктивність праці понад 370 ц/особу.

Отже при стохастичному зв”язку зі зміною значень ознаки х змінюється розподіл одиниць сукупності за ознакою у. При відсутності стахостичного зв”язку між ознаками умовні розподіли були б однакові і збігалися б з безумовним розподілом.

Підвидом стохастичної залежності є кореляційна,коли зі зміною факторної ознаки х змінюються групові середні результативної ознаки у, тобто замість умовних розподілів порівнюються середні значення цих розподілів.

У нашому прикладі обчислимо середню ПП у кожній групі за факторною ознакою х. У 6 господарствах І групи (урожайність до 70 ц/га) рівень ПП становить 239,9 ц/особу. У 2-й і 3-й – відповідно 342,8 і 434,1 ц/особу, тобто групові середні  зростають, що свідчить про наявність зв’язку між урожайністю та ПП.

Головна характеристика кореляційного зв”язку – це лінія регресії.

Лінія регресії у на х - це функція, яка зв”язує середні значення ознаки у зі значенням ознаки х.

Залежно від форми лінії регресії розрізняють :

- лінійний зв’язок;

- нелінійний зв’язок..

Лінія регресії має різні зображення :

- табличне

- аналітичне

- графічне (другорядне значення, ілюстративне)

На табличному та аналітичному зображенні грунтуються дві основні моделі кореляційного зв’язку:

- аналітичного групування;

- регресійна

Етапи їх побутови однакові:

  1.  Теоретичне обгрунтування моделі.
  2.  Оцінка лінії регресії.
  3.  Вимірювання тісноти зв’язку між ознаками, визначення ролі фактора х у зміні результатативної ознаки у.
  4.  Перевірка істотності зв’язку, доказ невипадкового характеру виявлених закономірностей.

8.2. Метод аналітичного групування.

Полягає у наступному: всі елементи сукупності групують, як правило, за факторною ознакою х і  в кожній групі обчислюють середні значення рез.ультативної ознаки у, тобто лінія регресії оцінюється лише в окремих точках, які відповідають певному значенню х.

І етап аналізу кореляційного зв”язку при обгрунтуванні моделі.

а) вибір факторних ознак;

б) визначення числа груп і меж інтервалів. При цьому необхідно пам”ятати,що типовість і сталість групових середніх  залежить від чисельності груп. На практиці метод аналітичного групування виконується за принципом рівних частот. Це значно спрощує подальший аналіз зв”язку.

ІІ етап оцінки лінії регресії. Оцінками лінії регресії є групові середні результативної ознаки.

а) у кожній групі за факторною ознакою обчислюється середнє значення результативної ознаки, тобто групові середні , які є оцінками лінії регресії.

У нас виділено при групуванні господарств за рівнем урожайності три групи: до 70, 70-140, понад 140 ц/га. Обчислимо у  кожній групі середню продуктивність праці.

Це обчислення за вихідними незгрупованими даними табл. 1.

За даними комбінаційного розподілу (табл. 2) розрахунок групових середніх менш точний.

Таблиця 3

Залежність продуктивності праці від урожайності

Групи господарств за урожайністю,ц/га.

Кількість господарств

Середня продуктивність праці, ц / ос,

Середня урожайність, ц/га,  .

До 70

6

239,93

53,95

70-140

10

342,84

102,27

Понад 140

4

434,10

169,4

Разом по сукупності

20

330,22

101,20

Аналіз даних табл. 3 свідчить про прямий зв”язок між урожайністю і продуктивністю праці.

Крім того, аналітичне групування дає змогу встановити кількісні співвідношення між ознаками, що вивчаються. Так, у другій групі порівняно з першою значення ознаки х вище на 48,32 ц/га (=102,27-53,95), а середнє значення ознаки у – на 102,91ц/ особу (=342,84-239,93). Отже з підвищенням урожайності на 1 ц/га продуктивність праці зростає у середньому на 2,13 ц/особу, тобто

(ц/особу).

При переході від другої до третьої групи

ІІІ етап  вимірювання тісноти зв”язку. Тіснота зв”язку вимірюється за допомогою кореляційного відношення .

Вимірювання тісноти зв”язку грунтується на правилі складання  дісперсій.

Загальна дісперсія  розпадається на міжгрупову  і середню із групових дисперсій  і обчислюється за індивідуальними значеннями ознаки у.

Міжгрупова дисперсія- це середньозважена з відхилень групових середніх.

Середня з групових

  

Економічний зміст дісперсій.

Загальна дісперсія продуктивності праці складається під впливом безлічі факторів: рівня урожайності, витрат добрив і т. ін. Отже, вона характеризує варіацію числових значень результативної ознаки, пов”язану з варіацією всіх факторів, що на неї впливають.

Групова та середня з групових дисперсій характеризують варіацію результативної ознаки у, пов”язану з варіацією всіх факторних ознак х, крім тієї, яка покладена в основу групування ( урожайність), бо в межах однієї групи всі господарства мають одну урожайність (у межах відповідного інтервалу), тобто на групову варіацію рівень урожайності не впливає.

Міжгрупова дісперсія характеризує варіацію групових середніх, тобто варіацію результатативної ознаки (ПП ), яка пов”язана з варіацією групувальної ознаки (урожайність).

Таким чином: загальна дисперсія результативної ознаки у складається з двох частин: міжгрупової (факторної) дісперсії (результат у залежить від групувальної ознаки х), та середньої з групових (залишкової), тобто вплив на у всіх факторів х крім групувальної ознаки (урожайності).

Відношення факторної (міжгрупової) дісперсії до загальної характеризує тісноту кореляційного зв”язку і тому його називають кореляційним відношенням

За статистичною структурою це відношення є частка варіації результ. ознаки у, яка пов”язана з варіацією факторної ознаки х. У нашому прикладі:

Таким чином, в обстеженій сукупності господарств 74,6 % варіації продуктивності праці пов”язані з різним рівнем урожайності.

Кореляційне відношення має такі межі зміни:

0 ≤ ŋ ² ≤1.

При  = 0 міжгрупова дісперсія  δ² = 0.

Це можливо коли всі  (групові середні) однакові і кореляційний зв”язок між ознаками відсутній.

При  = 1 міжгрупова дісперсія дорівнює загальній: δ² =  а середня із групових  = 0. В цьому випадку кожному значенню факторної ознаки відповідає єдине значення результативної ознаки, тобто зв’язок між ознаками функціональний.

Слід підкреслити, що > 0 не завжди є доказом наявності кореляційного зв’язку між ознаками (приклад випадкового розподілу сукупності на групи по парності чи непарності номера у списку. Групові середові будуть відрізнятися, тобто > 0 (кореляційне відношення не дорівнює нулю). Різниця групових тут випадкова і не свідчить про наявність зв’язку між продуктивністю праці і номером господарства за списком).

ІV етап перевірки істотності зв язку.

Перевірка істотності відхилень групових середніх здійснюється за допомогою критеріїв математичної статистики :  та F- критерію (критерій Фішера). Вона грунтується на порівнянні фактичного значення  з так званим критичним, яке є максимально можливим значенням кореляційного відношення, що може виникнути випадково при відсутності кореляційного зв’язку.

Якщо , то зв’язок між результативною та факторною ознаками істотний.

Якщо  – зв”язок неістотний і наявність кореляційного зв’язку між ознаками не доведена.

Критичне значення  вибирають так, щоб імовірність отримання значення , більшого від критичного, (за умовами відсутності зв”язку між ознаками) була достатньо мала. Таку імовірність називають рівнем істотності α.

Найчастіше в статистистико-економічних дослідженнях

α = 0,05  або α = 0,01.

Таблиця 4

Критичні значення кореляційного відношення  і коефіцієнта детермінації  для α = 0,05.

1

2

3

4

5

6

8

10

20

16

0,219

312

378

429

477

507

564

609

740

17

208

297

361

411

452

488

545

590

724

18

197

283

345

394

435

470

527

573

709

19

187

270

331

379

419

454

510

556

694

20

179

259

318

364

404

432

495

540

680

Розподіл  в цих таблицях залежить від числа ступенів вільності міжгрупової () і середньої з групових () дисперсій. В аналітичному групуванні вони обчислюються так :

= m – 1;        = n – m,

де n, m –відповідно кількість елементів сукупності та кількість груп. У нашому прикладі 20 господарств і 3 групи, отже

= 3 – 1 =2      ;  = 20 – 3 = 17

Для рівня істотності  = 0,05 при цих ступенях вільності

Тобто, при відсутності зв’язку між ознаками тільки у 5 випадках із 100  перевищить 0,30. У нашому прикладі  = 0,746 більше від критичного 0,297, що свідчить про істотність кореляційного зв’язку між продуктивністю праці та урожайністю.

Для перевірки істотності зв”язку використовують функціонально зв”язану з  характеристику F–критеріїв (крітерії Фішера), які обчислюються за формулами

 або.

Існують таблиці критичних значень F-критерію. Перевірку істотності з його допомогою здійснюють аналогічно описаній вище для кореляційного відношення .

У нашому прикладі , що значно більше від критичного F0,95( 2,17) = 3,59. Це свідчить про істотність кореляційного зв’язку між ознаками, які вивчають.

Комбінаційні аналітичні групування використовують для аналізу зв’язку результативної ознаки з двома і більше факторними ознаками від кожного з факторів при фіксованих значеннях інших. Методи вимірювання такого типу зв’язку та перевірки його істотності називають багатофакторними комплексами. Розрахунки тут громіздкі і потребують ЕОМ.

8.3. Основи кореляційно- регресійного аналізу.

У кореляційно-регресійному аналізі оцінка лінії регресії здійснюється не в окремих точках, як в методі аналітичного групування, а в кожній точці інтервалу зміни факторної ознаки х. Тобто лінія регресії у данім випадку безперервна і зображується у вигляді певної функції , яка називається рівнянням регресії, а  – це теоретичні значення результативної ознаки.

І етап. Теоретичне обгрунтовання моделі.

Розглянемо парну (тобто з однією факторною ознакою ) модель.

При виборі ії функціонального виду використовуються графіки, аналітичні групування та теоретичного обгрунтування.

При невеликому обсязі сукупності доцільно будувати графіки у вигляді кореляційного поля, де кожному елементу відповідає точка, а всі елементи утворюють скупчення точок. Загальний вигляд кореляційного поля дозволяє зробити висновок щодо форми лінії регресії.

При великому обсязі користуються методом аналітичного групування. Графік групових середніх є емпіричною лінією регресії.

Можливий перебір функцій. Обчислюють рівняння регресії різних видів, із них вибирають найкраще. Як правило, це рівняння з найвищим коефіцієнтом тісноти зв’язку між ознаками, що вивчають.

Серед безлічі функцій в статистико-економічному аналізі найпоширенішою є лінійна . Це пояснюється ії простотою та змістовністю параметрів. Крім того, факторна ознака варіює в невеликих межах, що дає змогу показати апроксимацію (наближення кривої до ламаної) звязку лінійною функцією.

Параметр  називають коефіцієнтом регресії. Він показує, на скільки одиниць власного виміру в середньому змінюється значення ознаки у зі збільшенням значення ознаки х на одиницю її власного розміру.

Параметр  - це значення у при х=0. Якщо х не може приймати нульових значень, то  економічно не інтерпретується і як вільний член рівняння має тільки розрахункове значення.

Побудований за даними табл. 1 графік кореляційного поля має вигляд лінійної функції.

Розміщення точок на графіку свідчить про можливість використання лінійного рівняння .

ІІ етап. Оцінка лінії регресії. Оцінками лінії регресії є теоретичні значення результативної ознаки у.

Визначають параметри обраного рівняння з допомогою метода нейменших квадратів. Основна умова методу полягає в мінімізації суми квадратів відхилень емпіричних значень у від теоретичних , тобто

.

Це дає можливість отримати найкращі оцінки параметрів  і . Для їх отримання складають і розв”язують систему нормальних рівнянь. Лінійній моделі відповідає система рівнянь з двома невідомими.

;

         .

У нашому прикладі:

                                     

Помножимо 1-е рівняння  на 101,2= і віднімемо друге рівняння від першого.

Лінійне рівняння регресійного зв’язку між продуктивністю праці та урожайністю має такий вигляд:

У = 154,84+1,733х.

Таким чином, при збільшенні урожайності на 1ц/га продуктивність праці зростає у середньому на 1,733 ц/особу. Цей коефіцієнт регресії близький до обчислюваних раніше ефектів моделі анал.групування (2,13 і 1,36 ц/особу)

Для дослідження форми зв’язку можуть бути використані й нелінійні рівняння регресії різних видів. У цьому разі при визначенні параметрів методом найменших квадратів рівняння регресії слід привести до лінійного вигляду шляхом певних перетворень.

Степенева функція  приводиться до лінійного вигляду логарифмуванням. .

Гіпербола  приводиться до лінійного вигляду заміною х новою зміною (її зворотнім значенням Z=). .

Парабола другого порядку  приводиться до лінійного вигляду заміною квадрату значень факторної ознаки (), в результаті чого дістанемо лінійну функцію від двох змінних .

Подальші розрахунки аналогічні лінійній моделі.

ІІІ етап визначення тісноти зв’язку.

Цей етап грунтується, як і в методі аналітичного групування, на привилі складання дисперсій. На відміну від методу аналітичного групування, де оцінками лінії регресії є групові середні результативної ознаки, в кореляційно-регресійному аналізі оцінками є теоритичні значення результативної ознаки.

Дисперсію теоретичних значень називають факторною (вона ж у методі аналітичного групування називається міжгруповою) і обчислюють

Як і в методі аналітичного групування, вона характеризує варіацію результативної ознаки у, пов’язану з варіацією факторної ознаки х.

Замість середньої із групових дисперсій обчислюють залишкову дисперсію

.

Вона характеризує  варіацію результативної ознаки у, не пов’язану з факторною ознакою х.

Наведені формули теоретичної та залишкової дисперсій потребують попереднього обчислення теоретичних значень  для всіх елементів сукупності. Наприклад, для  першого господарства

=154,840+1,733*50,3=242,01ц/особу

Аналогічно - для другого – двадцятого господарств.

Щоб зменшити осяг обчислень, на практиці використовують іншу розрахункову формулу дисперсії теоретичних значень (факторної дисперсії) без теоретичних значень

У нашому прикладі

Загальну дисперсію ознаки у визначено раніше , а залишкову визначають за правилом складання дисперсій.

.

Мірою тісноти зв’язку в кореляційно-регресійному аналізі є коефіцієнт детермінації , аналогічний кореляційному відношенню.

.

Цей коефіцієнт характеризує ту частину варіації результативної ознаки у, яка відповідає лінійному рівнянню регресії.

Отже, в обстеженій сукупності господарств 91,02% варіації продуктивності праці пояснюється різними рівнями урожайності.

Коефіцієнт детермінації , як і коререляційне відношення , приймає значення 0≤ ≤1. При = 0 дисперсія теоретичних значень = 0, всі теоретичні значення збігаються з середнім значенням . Лінійний кореляційний зв’язок між х і у відсутній.

При=1 дисперсія теоретичних значень дорівнює загальній, залишкова дисперсія дорівнює нулю; емпіричні значення у і теоретичні  збігаються, зв’язок між ознаками х і у лінійно-функціональний.

Індекс кореляції – це корінь квадратний із коєфіцієнта детермінації.

Як і , індекс кореляції змінюється в межах від 0 до1, характеризує тісноту зв’язку, але економічної інтерпритації не має.

Для вимірювання тісноти зв’язку при лінійній залежності використовують лінійний коефіцієнт кореляції

.

Межі зміни -1<  <+1. Він характеризує не тільки тісноту, а й напрям зв язку. Якщо r > 0, то це означає прямий зв”язок між ознаками, а якщо r < 0 – зворотній.

На практиці частіше використовують таку формулу для визначення :

Абсолютна величина  збігається з індексом кореляції R.

У прикладі : = 101,2; = 330,22 ;   

;

Отже r = .

ІУ етап. Перевірка істотності зв язку.

У кореляційно-регресійному аналізі перевірку істотності зв”язку здійснюють за допомогою тих самих критеріїв і за тими ж процедурами, що і в методі аналітичного групування. Ступені вільності залежать від числа параметрів рівняння регресії . Для лінійної моделі  Істотність зв”язку можна перевірити за допомогою таблиць критичних значень R². Так для рівня істотності = 0,05 критичне значення Фактичне значення R2 =0,910 значно перевищує критичне, що свідчить про істотність лінійного кореляційного зв’язку між продуктивністю праці і урожайністю.

У випадку, коли використовується F – критерій, фактичне значення визначають як

.

Критичне значення F 0,95 (1,18) = 4,41  значно менше за фактичне, що підтверджує істотність кореляційного зв”язку між ознаками, які вивчають.

У невеликих за обсягом сукупностях коефіціент регресії  схильний до випадкових коливань. Тому слід визначати відповідні межи цих коливань, тобто довірчий інтервал коефіцієнта регресії.

Середня помилка для  визначається за формулою

.

Величина граничної помилки залежить від імовірності Р.

,

де t- коефіціент довіри.

Для Р = 0,954  (t =2 ) гранична помилка  у два рази більша від середньої і становить .

Довірні межі коефіціента регресії :

1,733-0,256≤≤1,733=0,256

1,477≤≤1,989.

Отже, якщо урожайність збільшується на 1 ц/га, рівень продуктивності праці підвищується не менше, ніж на 1,477 і не більше,ніж на 1,989 ц/особу.

Як правило, кореляційно-регресійний аналіз проводиться за незгрупованими даними, але вихідна інформація може бути подана у вигляді аналітичного групування чи комбінаційного розподілу.

8.4. Множинна регресія.

Множинна регресія дає можливість оцінити зв”язок результативної ознаки з будь якою факторною при фіксованому значенні інших, включених в регресійну модель.

На практиці часто використовують множинні, багатофакторні рівняння регресії, коли на величину результативної ознаки впливає 2, 3 і більше факторів.

І етап. Теоритичне обгрунтування моделі і вибору факторних ознак.

Слід врахувати тісноту кореляційного зв”язку між ознаками. При наявності зв”язку, близького до функціонального (мультиколінеарності), оцінки параметрів багатофакторної моделі будуть ненадійними. Для оцінки мультиколінеарності між ознаками достатньо обмежити відповідні коефіціенти кореляції () двох факторних ознак. Якщо він близький до 1, то одну з них треба виключити. На цьому етапі важливо не тільки вибрати фактори, а й розкрити структуру взаємозв”зку між ними.

Обгрунтування функціонального вигляду багатофакторного рівняння регресії - це складна проблема.

Аналіз парних зв”язків непридатний, тому що фактори взаємозв”язані, а визначити зв”язок між у і  при фіксованих значеннях інших факторних ознак дуже складно. Тому на практиці найчастіше використовують багатофакторні лінійні рівняння та рівняння, що приводять до лінійних відповідними перетвореннями, тобто

.

Параметр рівняння називають частинним коефіцієнтом регресії.

Він показує, як у середньому, змінюється у зі зміною факторної ознаки  на одиницю її власного виміру за умови, що інші факторні ознаки залишаються незміними.

Для визначення параметрів складають і розв”язують систему нормальних рівнянь.

.

.

.

.

ІІ етап. Оцінка лінії регресії.

Оцінками лінії регресії є теоритичні значення – У.

Обчислимо параметри рівняння регресії, яке описує зв”язок продуктивності праці з такими показниками:

1)урожайністю;

2) витратами добрив.

Позначимо урожайність  , витрати добрив , продуктивність праці - у. Для нашого прикладу лінійне рівняння регресії матиме вигляд:

.

Складемо систему нормальних рівнянь.

6604,4 = 20 + 2024 +95;

734192,89 = 2024  +242806,96  +10474,55 ;

32986,13 = 95 + 10474,55  +508,98 .

Розв язання системи дає таке лінійне рівняння:

.

Отже, із збільшенням урожайності на 1 ц/га продуктивність праці збільшиться на 1,66 ц/особу за умови, що витрати добрив залишаються незмінними. Частинний коефіцієнт регресії при  1,660 нижчий від коефіцієнта при цій змінній у парній моделі - 1,733. Частинний коефіціент регресії при  3,234 показує середній приріст продуктивності праці при збільшенні витрат добрив на 1 тис.грн. за умови незмінної урожайності. Якщо обчислити параметри ленійного рівняння парної регресії  дістанемо = 197,300 + 27,979. Парна регресія показує прямий зв”язок між витратами добрив і продуктивністю праці. Причина розбіжностей частинних і парних коефіцієнтів регресій полягає у взаємозв”язку факторних ознак  і .

Передумову багатофакторного регресійного аналізу про можливість зміни кожного фактора окремо при незмінності інших факторних ознак на практиці здійснити важко. Як правило, зміна значень одного фактора викликає явні зміни у всій сестемі взаємозв”язаних факторів. Більш поглибленний статистичний аналіз взаємозв”язку факторів можливий при використанні систем рівнянь регресії (рекурентні системи).

Так за данними табл. 1 обчислені багатофакторні та парні регресійні моделі

= 154,840+1,733

= 197,300+27,979

= 146,864+1,660 +3,234

Залежність  від  можна описати рівнянням

=30,394+14,906 .

Схематично взаємозв язки трьох ознак зображено на рис 1.

                                      

                    3,234  1,660

                           

14,906

Рис. 1. Схема зв”язку трьох ознак.

Стрілки показують напрям зв”язку, цифри над стрілками – відповідно коефіцієнти регресії: частинні для пар  -  та  -   і парні для  - .

В обстеженій сукупності господарств збільшення витрат добрив на 1 тис.грн. приводить до збільшення продуктивності праці на 3,234 ц/особу, що було б правильно, якби при цьому залишилась незмінною урожайність. Насправді ж зі збільшенням витрат добрив урожайність збільшилась на 14,906 ц /га. Оскільки з підвищенням урожайності на 1 ц/га. відповідно збільшиться продуктивність праці на 1,66 ц/особу, то підвищення урожайності на 14,906 ц /га. відповідно збільшить продуктивність праці на 24,744 ц/особу, тобто на 1,66*14,906 = 24,744. Таким чином, вплив фактора  – це сума двох складових частин: безпосереднього впливу  і опосередкованого - . Слід зауважити, що повний вплив (повний коефіцієнт регресії) збігається з парним коефіціентом регресії  на  (27,979). Розглянутий приклад - найпростіший випадок систем рівнянь регресії, які називаються рекурентними. Вони являють собою ефективний метод аналізу структури причинно-наслідкових зв”язків.

ІІІ етап. Оцінки тісноти зв”язку.

Тісноту зв”язку між результативною ознакою та сукупністю факторних ознак визначають за допомогою сукупного коефіцієнта детермінації.

,

де  - теоретична дисперсія багатофакторного рівняння регресії.

Сукупний кофіцієнт детермінації характеризує частку варіації результативної ознаки, яка лінійно пов”язана з варіацією включених у рівняння регресії факторних ознак.

Теоретичну дисперсію обчислюють за формулою

.

Сукупний коефіцієнт детермінації

.

Таким чином, у обстеженій сукупності господарств 91,13% варіації продуктивності праці лінійно пов”язані з різним рівнем урожайності та витрати добрив.

Визначення зв”язку в моделях множинної регресії доповнюється оцінкою тісноти зв”язку з кожною факторною ознакою окремо. Для цього застосовують частинні коефіцієнти детермінації.

Для розрахунку цих коефіцієнтів для зв”язку у і  порівняємо дві регресійні моделі: рівняння з двома ознаками  і  та рівняння без ознаки . Дві факторні ознаки пояснюють 91,13% варіації ознаки  (коефіцієнт детермінації 0,3590). Таким чином, введення в модель ознаки  пояснює додатково 55,23 % варіації ознаки .

0,9113 – 0,3590 = 0,5523.

Оскільки ознака  пояснює 35,9% варіації ознаки , то 64,1% варіації залишається непоясненою, тобто

Це максимально можлива частка варіації, яку може пояснити додатково введена в рівняння регресії факторна ознака  

Відношення додатково поясненої варіації до максимально можливої і є частиним коефіцієнтом детермінації ознаки . Його визначають так:

.

Отже, варіація урожайності пояснює 86,16% варіації продуктивності праці, непоясненої фактором  (витратами добрив).

Частинний коефіцієнт детермінації ознаки  обчислюється так:

.

Лише 1,22% варіації продуктивності праці додатково пояснюється варіацією витрат добрив.

IV етап перевірки істотності зв’язку.

Його здійснюють з допомогою двох критеріїв математичної статистики:

F – критерію;

- коефіцієнтів детермінації;:

- критерію Стьюдента .

Для частинного коефіцієнта детермінації число ступенів вільності =1.

Для сукупного коефіцієнту детермінації =m-1=3-1=2; =n-m=

20-3=17. Для рівня істотності =0,05 критичне значення R20.95(2,17) = 0,297.

Фактичне значення  значно перевищує критичне, тому істотність зв’зку результативної ознаки з обома факторами доведена.

Розглянемо істотність зв’язку з кожною з факторних ознак окремо. Для частинного коефіцієнта детермінації критичне значення R20.95(1,17) = 0,208. Для ознаки  фактичне значення =0,8616 більше від критичного, що свідчить про істотність частинного зв’язку  з . Для ознаки  = 0,0122 менше від критичного і наявність частинного зв’язку  і  не доведена.


 

А также другие работы, которые могут Вас заинтересовать

35222. Шектеулі рұқсат қалдықтар 135 KB
  Адам баласының кез-келген шаруашылық іс-әрекеті әртүрлі қалдықтармен биосфераны ластайды, бұл халықтың денсаулығы мен өміріне, флора мен фауна түрлерінің қысқарылуына, қоршаған ортадағы тепе-теңдікке қауіп-қатер тудырады. Кен үйінділерін, өнеркәсіп тастандыларын
35223. Технічні пристрої организаціїї і регулювання руху транспорту. Регулювання вуличного руху 1.24 MB
  снують дорожні знаки за характером і організації інформації вирішують локальні завдання. Це, як правило, конконкретна інформація попередження, заборони, приписи, не враховує оперативних змін дорожніх і метеорологічних факторів, умов освітлення, характеристик транспортного потоку...
35224. Створення баз даних та робота з ними 147 KB
  Мета: вивчити структуру вікна додатка MS Access і основні засоби роботи з базами даних..
35225. MS Access. Створення бази даних у вигляді декількох таблиць 168 KB
  Створення бази даних у вигляді декількох таблиць. План Основні поняття про бази даних. Задача Успішність Створити базу даних з трьох таблиць: Оцінки рис. Основні поняття про бази даних.
35226. КЛИНИКА, ДИАГНОСТИКА И ЛЕЧЕНИЕ ПОРАЖЕНИЙ ТОКСИЧНЫМИ ХИМИЧЕСКИМИ ВЕЩЕСТВАМИ 975.5 KB
  Яд – вещества вызывающие отравления в малых количествах. Понятие «малое количество» носит весьма субъективный характер. Некоторые яды вызывают смертельные исходы в дозах равных нескольким нанограммам (ботулотоксин), другие вещества (суррогаты алкоголя) вызывают отравления при поступлении в организм в количестве десятков, сотен грамм.
35228. Основи організації вуличного руху транспорту. Схеми переміщення транспорту. Організація руху на міських вулицях 18.73 KB
  Раціональна організація руху транспорту в містах дозволяє забезпечити високу швидкість і безпеку руху, найбільші зручності для пасажирів и економічність перевезень.
35229. Модифікація даних. Створення вихідних документів 126.5 KB
  Мета: Навчитися модифікувати дані, які знаходяться в таблицях. Навчитися створювати прості вихідні документи.
35230. Створення екранних форм 453.5 KB
  Создаем запрос для формы Рыночные цены Создаем ленточные формы Рыночные цены на основе запроса Рыночные цены и Справочник товаров с помощью мастера форм Открываем с помощью конструктора форму Рыночные цены Для создания расчетных итоговых полей которые содержат средние значения полей необходимо на панели элементов сначала нажать на кнопку поле b потом в Обпасти данных выделить место для построения расчетного итогового поля. Создаем форму Товары с помощью мастера форм Для создания иерархичной формы Товары и их цены в...