69223

Статистичні методи вивчення взаємозв’язків

Лекция

Социология, социальная работа и статистика

Кореляційно-регресійний аналіз зв’язку його завдання і основні етапи. Оцінка щільності та істотності кореляційного зв’язку. При функціональному зв’язку кожному можливому значенню факторної ознаки відповідає чітко визначене значення результативної ознаки тобто...

Украинкский

2014-10-01

398.5 KB

2 чел.

ТЕМА 10.Статистичні  методи  вивчення  взаємозв’язків.

Основні  методи  виявлення  наявності  зв’язку.

Види  зв’язків  соціально - економічних  явищ  та  завдання   їх  соціально – економічного  вивчення.

 Кореляційно – регресійний  аналіз  зв’язку,  його  завдання  і  основні  етапи.

  Оцінка  щільності  та  істотності  кореляційного  зв’язку.

Література:77-101

Види  взаємозв’язків  між  явищами .

Застосування  комбінаційного  групування  для  виявлення  статистичної  закономірності

Виявлення  статистичної  закономірності  -  одна  з  найважливіших  задач  статистики

  За  статистичною  природою  зв’язки  поділяють  на  функціональні  та  стохастичні.  При  функціональному  зв’язку  кожному  можливому  значенню  факторної  ознаки    відповідає  чітко  визначене  значення  результативної  ознаки  ,  тобто  функціональні  зв’язки  характеризуються  повною  відповідністю  між  причиною  і  наслідком,  факторною  і  результативною  ознаками.  Така  залежність  притаманна  фізичним  ,  хімічним  явищам  тощо.  В  суспільних  процесах  це  найчастіше  зв'язок  складових  елементів  розрахункових  формул  відповідних  показників,  наприклад,  залежність  врожайності  сільськогосподарської  культури  від  валового  збору  і  розміру  посівної  площі.

  При  стохастичному  зв’язку  кожному  значенню  ознаки    відповідає  певна  множина  значень  ознаки  ,  які  варіюють  і  утворюють  ряд  розподілу  (умовний).  Стохастичний  зв'язок  проявляється  зміною  умовних  розподілів.

  Розглянемо  показники  розвитку  садівництва  у  двадцяти   господарствах  приміської  зони  Києва:

Таблиця  № 1.

Показники  розвитку  садівництва  у  20  господарствах    приміської  зони  Києва.

 

Номер господарства

Урожайність насіннєвих  та кісточкових  плодів, ц/га

      

Витрати  органічних та  мінеральних добрив з розрахунку на 100 га насіннєвих та кісточкових насаджень в плодопосівному віці, тис. грн..

             

Виробництво насіннєвих та кісточкових плодів на одного працівника, ц

       

     1

          2

                      3

              4

1

50,3

1,5

203,1

2

40,8

2,5

200,3

3

55,0

3,3

242,7

4

44,0

4,0

228,0

5

67,7

5,7

308,5

1

2

3

4

6

65,9

3,0

257,0

7

79,6

2,9

308,6

8

89,4

4,1

316,2

9

72,3

4,5

280,1

10

110,5

3,1

358,9

11

120,0

6,2

360,6

12

131,7

4,3

365,4

13

92,8

7,1

340,8

14

136,0

4,5

422,0

15

97,0

5,3

365,0

16

93,4

7,7

310,8

17

178,3

7,2

420,0

18

143,7

6,8

380,7

19

165,4

5,4

425,4

20

190,2

5,9

510,3

Дослідимо   також   урожайність   насіннєвих  та  кісточкових   плодів  і  їх  виробництво  на  одного  працівника  (  продуктивність  праці)  та  розрахуємо  комбінаційний    розподіл  господарств  за  двома  ознаками  ( табл..2.)

Таблиця  № 2.  

Розподіл  20  господарств  за  урожайністю  та  продуктивністю  праці  у  садівництві.

Група  господарств  за  врожайністю

(ц/га)

Кількість  господарств  за  рівнем  продуктивності  праці

(Ц).

разом

До  270

270-320

320-370

370 і більше

До  70

70 – 140

Понад 140

5

-

-

1

4

-

-

5

-

-

1

4

6

10

4

Разом

5

5

5

5

20

Побудовану  таким  чином  таблицю  називають  таблицею  співзалежності.  Кожен  її  рядок  (  крім  підсумку)  містить  частоти  розподілу  господарств  за рівнем  виробництва  насіннєвих  та  кісточкових  плодів  при  фіксованому  значенні  врожайності,  тобто  частоти умовного  розподілу.  підсумковий  рядок  містить  частоти  безумовного  розподілу.  у  даному  випадку  зв'язок  між  ознаками  стохастичний,  оскільки  кожному  значенню,  (інтервалу  значень)  ознаки    відповідає  декілька  значень  ознаки   .  частоти  розташовані  у  таблиці  №2  по  діагоналі:  в  першій  групі  з  низьким  рівнем  урожайності     (до  70 ц/га)  переважають  господарства  з  низьким  рівнем  продуктивності  праці;  у  третій  групі  (понад  140 ц/га)  усі  господарства  мають  продуктивність  праці    понад  370 ц.

   Отже,  при  стохастичному  зв’язку  зі  зміною  значень  ознаки   змінюється  розподіл  одиниць  сукупності  за  ознакою  .  При  відсутності  стохастичного  зв’язку  між  ознаками  умовні  розподіли  були  б  однакові  і  збігалися  б  з  безумовним  розподілом. к

  Підвидом  стохастичної  залежності  є  кореляційна,  коли  зі  зміною  факторної  ознаки    змінюються  групові  середні  результативної  ознаки  ,  тобто  замість  умовних  розподілів  порівнюються  середні  значення  цих  розподілів.  У  наведеному  прикладі  обчислимо  середню  продуктивність  праці  у  кожній  групі  за  фактичною  ознакою  .  У  шістьох  господарствах  першої  групи (урожайність менш  як  70 ц/га)  рівень  продуктивності  праці                  становить  239,9 ц.  у  другій  та  третій  групах – відповідно  342,8  і  434,1 ц,  тобто  групові  середні   зростають,  що  свідчить  про  наявність  зв’язку  між  урожайністю  та  продуктивністю  праці.

  Головною  характеристикою  кореляційного  зв’язку  є  лінія  регресії.  Лінія  регресії    на   - це  функція,  яка  зв’язує  середні  значення ознаки   зі  значеннями  ознаки  .  Залежно  від  форми  лінії  регресії  розрізняють  лінійний  і  нелінійний  зв’язки.

  Лінія  регресії  може  мати  різні  зображення:  табличне,  аналітичне,  графічне.  Як  правило,  графіки  мають  другорядне,  переважно  ілюстративне,  значення.  На  табличному  та  аналітичному  зображенні  лінії  регресії  ґрунтуються  дві  основні  моделі кореляційного  зв’язку – аналітичного  групування  і  регресійна.  Етапи  побудови  їх  однакові,  тобто   теоретичне  обґрунтування  моделі;  оцінка  лінії  регресії;  вимірювання  тісноти  зв’язку  між  ознаками,  визначення  ролі  фактора   у  зміні  результативної  ознаки  ;  перевірка  істотності  зв’язку,  доказ  невипадкового  характеру  виявлених  закономірностей.

Застосування  аналітичного  групування  до  виявлення  статистичної  закономірності.

Метод  аналітичного  групування  полягає  в  тому,  що  всі  елементи  сукупності  групують,  як  правило,  за  факторною  ознакою    і  в  кожній  групі  обчислюють  середні  значення  результативної  ознаки  ,  тобто  лінія  регресії  оцінюється  лише  в  окремих  точках,  які  відповідають  певному  значенню  .

   На  першому  етапі  кореляційного  зв’язку  при  обґрунтуванні  моделі  постають  два  питання:  вибір  факторних  ознак  і    визначення  числа  груп     і  меж   інтервалів.  При   визначенні  числа  груп  і  меж  інтервалів  слід  зважити  на   той  факт,  що  типовість  та  сталість  групових  середніх  залежить  від  чисельності  груп.   На  практиці  аналітичне  групування  часто  виконується  за   принципом  рівних  частот,  що  значно  спрощує  подальший  аналіз  зв’язку.

 На  другому  етапі  проводиться  оцінка   лінії  регресії – у  кожній  групі  за  факторною  ознакою обчислюють  середні  значення   результативної  ознаки.

У  нашому  прикладі   при  групуванні  господарств  за  рівнем  урожайності  виділено  три  групи:   до  70  ц/га,  від  70  до  140 ц/га  і  понад  140  ц/га.   В  кожній  групі  обчислимо  середню  продуктивність  праці.

 Групові  середні  обчислені  за  незгрупованими  даними.   Так  для  перщої  групи  господарств     середня  продуктивність  праці  становить  239,9 ц:

 ц.

 Розрахунок  групових  середніх  за  даними  комбінаційного  розподілу  будуть  менш  точними.

  

Таблиця №3.

Залежність  продуктивності  праці  від  урожайності.

Група господарств  за  урожайністю, ц/га  

 

Кількість  господарств

Середня  продуктивність праці, ц

Середня  урожайність,

ц/га      

До  70

70 – 140

Понад  140

6

10

4

239,93

342,84

434,10

53,95

102,27

169,40

У цілому  по

сукупності

20

330,22

101,20

  Аналіз  даних  таблиці  №3  свідчить  про  прямий  зв'язок  між  урожайністю  і  продуктивністю  праці.  Крім  того,  аналітичне  групування  дає  змогу  встановити  кількісні  співвідношення  між  ознаками,  що  вивчаються.  Так,  у  другій  групі  порівняно  з  першою  значення  ознаки    вище  на  48,32 ц/га

                                        ( ),

а  середнє  значення  ознаки    - на  102,91 ц  

                                         ( ).

Отже,  з  підвищенням  урожайності  на  1 ц/га  продуктивність  праці  зростає  в  середньому  на  2,13 ц,  тобто

                                            .

  При  переході  від  другої  до  третьої  групи  

            ц.

  Третій  етап  аналітичного  групування – вимірювання  тісноти  зв’язку – ґрунтується  на  правилі  складання  дисперсії:  загальна  дисперсія    розпадається  на  між групову   і  середню  із  групових  дисперсій    і  обчислюється  за  індивідуальними  значеннями  ознаки  .

Таблиця №4.

Розрахункова  таблиця  для  обчислення   дисперсій.

Порядковий №

Порядковий

1

2

3

4

5

6

7

8

9

10

203,1

200,3

242,7

228,0

308,5

257,0

308,6

316,2

280,1

358,9

41249,61

40120,09

58903,29

51984,00

95172,25

66049,00

95233,96

99982,44

78456,01

128809,21

11

12

13

14

15

16

17

18

19

20

360,6

365,4

340,8

422,0

365,0

310,8

420,0

380,7

425,4

510,3

130032,36

133517,16

116144,64

17804,00

133225,00

96596,64

176400,00

144932,49

180965,16

260406,09

Разом

 

Разом

6604,4

2306263,0

 

                             .

Отже  загальна  дисперсія   дорівнює  6281,11.

Розрахунок  міжгрупової  дисперсії  розглянемо  в  таблиці №5.

Таблиця №5.

Розрахунок  міжгрупової  дисперсії  в  аналітичному  групуванні.

Група господарств  за  урожайністю,  ц/га

До  70

70 – 140

Понад  140

6

10

4

239,93

342,84

434,10

-90,29

12,62

103,88

8152,28

159,26

10791,05

48913,70

1592,64

43164,22

Разом

20

330,22

93670,56

Між групова  дисперсія     - це  середньозважена  з  відхилень  групових  середніх   

          .

Середню  з  групових  дисперсій  можна  обчислити  за  формулою

                                                ;

Або  використати  правило  складання  дисперсій

   .

  Розглянемо  економічний  зміст  обчислених  дисперсій.  Загальна  дисперсія  продуктивності  праці  в  господарствах  складається  під  впливом  безлічі  факторів:  рівня  урожайності,  витрат  мінеральних  та  органічних  добрив  тощо.  Отже,  вона  характеризує  варіацію  числових  значень  результативної  ознаки,  пов’язану  з  варіацією  всіх  факторів,  що  на  неї  впливають.

  Усі  господарства  однієї  групи  мають  однаковий  рівень  урожайності  (у  межах  відповідного  інтервалу),  тобто  на  групову  варіацію  рівень  урожайності  не  впливає;  групові  і  середня  з  групових  дисперсій  характеризують  варіацію  результативної  ознаки,  пов’язану  з  варіацією  всіх  факторних  ознак,  крім  тієї,  яка  покладена  в  основу  групування.

  Міжгрупова  дисперсія  характеризує  варіацію  групових  середніх,  тобто  варіацію  результативної  ознаки,  яка  пов’язана  з  варіацією  групувальної  ознаки.

  Таким  чином,  загальна  дисперсія  результативної  ознаки    складається  з  двох  частин:  міжгрупової,  факторної  дисперсії  та  середньої  з  групових,  залишкової.  Відношення  факторної  дисперсії  до  загальної  характеризує  тісноту  кореляційного  зв’язку  і  тому  його  називають  кореляційним

                                                  .

  За  статистичною  структурою  це  відношення  є  часткою  варіації  результативної  ознаки  ,  яка  пов’язана  з  варіацією  ознаки  .  У  нашому  прикладі

                                             .

ОЦІНКА  ЩІЛЬНОСТІ  ТА  ПЕРЕВІРКА  ІСТОТНОСТІ

КОРЕЛЯЦІЙНОГО  ЗВЯЗКУ

  Поряд  із  визначенням  характеру  та  ефектів  впливу  факторів    на  результат    важливе  значення  має  оцінка  щільності  зв’язку,  тобто  оцінка  узгодженості  варіації  взаємозв’язаних  ознак.  Якщо  вплив  факторної  

ознаки   на  результативну    значний,  це  виявиться  в  закономірній  зміні  значень    зі  зміною  значень  ,  тобто  фактор    своїм  впливом  формує  варіацію  .  За  відсутності  щільного  зв’язку  варіація    не  залежить  від  варіації  .

  Для  оцінювання  щільності  зв’язку  статистика  використовує  низку  коефіцієнтів  з  такими  спільними  властивостями:

  * за  відсутності  будь-якого  зв’язку  значення  коефіцієнта  наближається  до  нуля;  при  функціональному  зв’язку – до  одиниці;

  * за  наявності  кореляційного  зв’язку  коефіцієнт  виражається  дробом,  який  за  абсолютною  величиною  тим  більший,  чим  щільніший  зв'язок.

  Серед  мір  щільності  зв’язку  найпоширенішим  є  коефіцієнт  кореляції  Пірсона.  Позначається  цей  коефіцієнт  символом  .  Оскільки  сфера  його  використання  обмежується  лінійною  залежністю,  то  і  в  назві  фігурує  слово  «лінійний».  Обчислення  лінійного  коефіцієнта  кореляції    ґрунтується  на  відхиленнях  значень  взаємозв’язаних  ознак    і    від  середніх.

  За  наявності  прямого  кореляційного  зв’язку  будь-якому  значенню    відповідає  значення  ,  а    відповідає  .  Узгодженість  варіації    і    схематично  показано  у  вигляді  кореляційного  поля  зі  зміщеною  системою  координат.

Мал.. 2. узгодженість  варіації  взаємозв’язаних  ознак.

Точка  координатами  якої  є  середні    і  ,  поділяє  кореляційне  поле  на  чотири  квадранти,  в  яких  по-різному  поєднуються  знаки  відхилень  від  середніх:

Таблиця №6.

Квадранти      

    І

     +

     +

    ІІ

      -

      +

    ІІІ

      -

     -

    ІV

     +

      -

 

 Для  точок,  розміщених  у  І  та  ІІІ  квадрантах,  добуток    додатний,  а  для  точок  з  квадрантів  ІІ  і  ІV – відємний.  Чим  щільніший  зв'язок  між  ознаками    і  ,  тим  більша  алгебраїчна  сума  добутків  відхилень  .  Гранична  сума  цих  добутків  дорівнює

                                            .

  Коефіцієнт  кореляції  визначається  відношенням  зазначених  сум:

                                     .

  Очевидно,  що  в  разі  функціонального  зв’язку  фактична  сума  відхилень  дорівнює  граничній,  а  коефіцієнт  кореляції  ;  при  кореляційному  зв’язку  абсолютне  його  значення  буде  тим  більшим,  чим  щільніший  зв'язок.

  На  практиці  використовують  різні  модифікації  наведеної  формули  коефіцієнта  кореляції.  Для  оцінювання  щільності  зв’язку  між  кількістю  внесених  добрив  та  врожайністю  зернових  скористаємося  однією  з  модифікацій  зазначеної  формули:

                                         .

  Коефіцієнт  кореляції,  оцінюючи  щільність  зв’язку,  указує  також  на  його  напрям:  коли  зв'язок  прямий,  - величина  додатна,  а  коли  він  зворотний – від’ємна.  Знаки  коефіцієнтів  кореляції  і  регресії  однакові,  величини  їх  взаємозв’язані  функціонально:

                            ;               .

Завдяки  цьому  один  коефіцієнт  можна  обчислити,  знаючи  інший.

 

  Корінь  квадратний  з  коефіцієнта  детермінації  називають  індексом  

кореляції  .  Коли  зв'язок  лінійний,   ,  що  підтверджують  обчислення:

.  Тому  за  відомим  лінійним  коефіцієнтом  кореляції   можна  визначити  внесок  ознаки   у  варіацію  ознаки  .

  На  таких  самих  засадах  ґрунтується  оцінювання  щільності  зв’язку  за  даними  аналітичного  групування.  Мірою  щільності  зв’язку  є  кореляційне  відношення

                                                  ,

де   - між групова  дисперсія,  яка  вимірює  ознаки    під  впливом  

фактора  ,  а   - загальна  дисперсія.

 Розглянемо  комбінаційний  розподіл  шахт  за  глибиною  розробки  пластів  та  фондомісткістю  вугілля.

Таблиця № 7.

Комбінаційний  розподіл  шахт  за  глибиною  розробки  пластів  та  фондомісткістю  вугілля.

Глибина розробки  пласта, м

Кількість шахт з рівнем фондомісткості,                 

                       грн./т.

Середній  рівень    фондомісткості

     Грн./т.

До  20

20-22

22-24

24-26

26  і  більше

Разом

До  300

300-500

500-700

700 і більше

9

7

8

1

27

6

5

15

8

4

10

17

40

25

18

20,0

22,9

24,8

26,1

По сукупності  і в  цілому

9

15

34

28

14

100

23,5

 

Застосуємо  кореляційне  відношення  для  оцінювання  щільності  зв’язку  між  глибиною  розробки  вугільних  пластів  і  фондомісткістю  видобутку  вугілля.  Розрахунки  загальної  та  факторної  дисперсій  розглянемо  в  таблицях № 8,

та № 9.

Таблиця №8.

До  розрахунку  загальної  дисперсії  фондомісткості  вугілля   .

Фондомісткість,грн./т

18-20

20-22

22-24

24-26

26-28

разом

Кількість шахт

9

15

34

28

14

100

            

19

21

23

25

27

            

           

-4,5

182,25

-2,5

93,75

-0,5

8,5

1,5

63,0

3,5

171,5

519

Згідно  з  розрахунками  загальна  дисперсія  становить  5,19,  факторна – 3,86:

                                          ;

                                          .

  Кореляційне  відношення

                                          ,

Тобто  74,5%  варіації  фондомісткості  вугілля  на  шахтах  регіону  пояснюються  варіацією  глибини  розробки  пластів.

Таблиця № 9.

До  розрахунку  факторної  дисперсії  фондомісткості  вугілля    .

Глибина розробки

пластів ,  м

     

  

До  300

17

20,0

-3,5

208,25

300-500

40

22,9

-0,6

14,40

500-700

25

24,8

1,3

42,25

700  і  більше

18

26,1

2,6

121,68

У  цілому

100

23,5

386,58

 

  Обчислення  та  інтерпретація  коефіцієнта  детермінації    і  кореляційного  відношення    показують:  ці  характеристики  щільності  зв’язку  за  змістом  ідентичні,  вони  характеризують  внесок  фактора    у  загальну  варіацію  результату  .

  Перевірка  істотності  кореляційного  зв’язку  ґрунтується  на  порівнянні  фактичних  значень   і    з  критичними,  які  могли  б  виникнути  за  відсутності  зв’язку.  Якщо  фактичне  значення    чи    перевищує  критичне,  то  зв'язок  між  ознаками  не  випадковий.

  Гіпотеза,  що  перевіряється,  формулюється  як  нульова:

                   або     .

Критичні  значення  характеристик  щільності  зв’язку  для  рівня  істотності     і  відповідного  числа  ступенів  свободи   для  факторної  дисперсії    і  залишкової   наведено  в  таблиці № 10.

Таблиця  №  10.  

Критичні  значення  коефіцієнта  детермінації    і  кореляційного  відношення      для  рівня  істотності  .

1

2

3

4

5

50

0,075

113

143

170

194

60

063

095

121

144

165

80

047

072

093

110

127

100

038

058

075

090

103

120

032

049

063

075

087

200

019

030

038

046

053

 Так,  критичне  значення  коефіцієнта  детермінації  для      і      у  таблиці  відсутнє  ,  тому  можна  використати  найближче  до  нього  число    =100 .  критичне  значення  ,  розраховане  за  даними  таблиці  13  кореляційне  відношення    значно  перевищує  критичне,  а  отже  гіпотеза  про  випадковий  характер  відхилень  групових  середніх  відхиляється.   Зв’язок  між  глибиною  розробки  вугільних  пластів   і  фондомісткістю  видобутку  вугілля    з  імовірністю  0,95  визнається  істотним.

  Розглянута  процедура  перевірки  істотності  зв’язку  є  складовою  дисперсійного  аналізу,  розробленого  Р. Фішером.  Характеристика  критерію  Фішера – дисперсійне  відношення  - функціонально пов’язана  з  кореляційним  відношенням  ,  а  тому  результати  перевірки  будуть  ідентичні.

.  


 

А также другие работы, которые могут Вас заинтересовать

9460. Оплата труда. Понятие и структура оплаты труда работникам. Методы правового регулирования заработной платы. 122.5 KB
  Оплата труда. Понятие и структура оплаты труда работникам. Методы правового регулирования заработной платы. Минимальный размер оплаты труда. Тарифная система оплаты труда. Формы и системы оплаты труда. Оплата труда рабо...
9461. Гарантийные и компенсационные выплаты 43.5 KB
  Гарантийные и компенсационные выплаты. Понятие и виды гарантийных выплат и доплат работникам. Гарантии - это средства, способы и условия, с помощью которых обеспечивается осуществление предоставленных работникам прав в области социально-т...
9462. Дисциплина труда. Внутренний трудовой распорядок. Понятия и способы установления 39.5 KB
  Дисциплина труда. Внутренний трудовой распорядок. Понятия и способы установления. Эффективность труда может быть обеспечена только при наличии четкого трудового распорядка у каждого работодателя. Внутренний трудовой распорядок или трудовой распорядо...
9463. Понятие особенной части и научные основы квалификации преступлений 55.5 KB
  ТЕМА №1: Понятие особенной части и научные основы квалификации преступлений. понятие особенной части. Единство общей и особенной частей. система особенной части уголовного законодательства и принципы ее построения. пон...
9464. Преступление против жизни 83 KB
  Тема №2: Преступление против жизни. Постановление пленума Верховного Суда о судебной практике по делам об убийстве от 27 января 1999 года понятие, система и виды преступлений против личности понятие и виды преступлений против жизни...
9465. Преступления против здоровья 81 KB
  Тема № 3: Преступления против здоровья. общая характеристика и виды. преступления против здоровья, сопряженные с причинением вреда определенной тяжести (ст. 111, 112, 113, 114, 115, 118 УК РФ) иные преступления против з...
9466. Преступления, ставящие в опасность жизнь и здоровье человека 52.5 KB
  Тема №4: Преступления, ставящие в опасность жизнь и здоровье человека. Общая характеристика. Видовой объект Безопасность жизни и здоровья граждан Объективная сторона Значительная часть преступлений совершаются путем бездействия (ст.125), возможн...
9467. Преступления против свободы, чести и достоинства личности 74 KB
  Тема №5: Преступления против свободы, чести и достоинства личности. Общая характеристика. Ст. 3 всеобщей декларации прав человека - каждый человек имеет право на свободу и личную неприкосновенность. Ст.21 и 23...
9468. Преступления против половой свободы и половой неприкосновенности 50.5 KB
  Преступления против половой свободы и половой неприкосновенности. Общая характеристика половых преступлений. Половые преступления - предусмотренные уголовным законом общественно-опасные деяния, грубо нарушающие сложившийся в обществе уклад секс...