18398

Аналіз таблиць взаємної спряженості( співзалежності)

Лекция

Социология, социальная работа и статистика

Тема 9. Аналіз таблиць взаємної спряженості співзалежності. 9.1. Таблиці співзалежності. 9.2. Рангова кореляція. 9.1. Таблиці співзалежності. При стохастичному звязку кожному значенню ознаки х відповідає певна множина значень ознаки у які варіюють і утворюють ряд р

Украинкский

2013-07-08

193.5 KB

39 чел.

Тема 9. Аналіз таблиць взаємної спряженості( співзалежності).

9.1. Таблиці співзалежності.

9.2. Рангова кореляція.

9.1. Таблиці співзалежності.

При стохастичному звязку кожному значенню ознаки х відповідає певна множина значень ознаки у, які варіюють і утворюють ряд розподілу (умовний). Стохастичний звязок проявляється зміною умовних розподілів.

Розглянемо комбінаційну таблицю як результат комбінаційного розподілу господарств за двома ознаками одночасно (за урожайністю та продуктивністю праці у садівництві) (табл.1).

Таблиця 1

Комбінаційний розподіл господарств за урожайністю та продуктивністю праці

Групи за врожайністю,

ц/га

Кількість господарств за рівнем продуктивності праці, ц

Разом

до 270

270-320

320-370

370 і більше

До 70

5

1

-

-

6

70-140

-

4

5

1

10

понад 140

-

-

-

4

4

Разом

5

5

5

5

20

Побудовану таким чином табл.1 називають таблицею співзалежності (взаємної спряженості). У ній у рядках, крім підсумкового, розміщені частоти (частки) умовних розподілів господарств за рівнем продуктивності праці при фіксованому значенні урожайності (при умові, що урожайність зафіксована - умовні розподіли). Підсумковий рядок містить частоти безумовного розподілу. Порівняння частот умовних розподілів дає можливість визначити наявність стохастичного звязку. У даному випадку звязок між ознаками стохастичний, оскільки кожному значенню (інтервалу значень) ознаки х відповідає декілька значень ознаки у, а частоти розміщені та сконцентровані по діагоналі. При відсутності стохастичного зв’язку між ознаками умовні розподіли були б однакові і збігалися б з безумовним розподілом.

Методи аналітичного групування та кореляційно-регресійного аналізу використовують основні параметри розподілу - середні та дисперсії. Тому ці методи називаються параметричними.

У статистиці широко застосовуються і непараметричні методи визначення взаємозв’язків, які ґрунтуються на кількісних значеннях ознак і не потребують обчислення параметрів їх розподілів. Крім того непараметричні методи застосовуються не тільки тоді, коли ознаки (всі, як у кореляційно-регресійному аналізі, чи результативна, як у методі аналітичного групування) – ознаки метричної шкали, а й тоді, коли є ознаки порядкової (рангової ) чи номінальної шкал. Ця перевага одночасно має й недолік – досягається менша глибина аналізу взаємозв’язку: за їх допомогою визначають лише тісноту та перевіряють істотність зв’язку.

На підставі таблиць взаємної спряженості (співзалежності) аналізуються взаємозв’язки між атрибутивними ознаками. Можна методи аналізу таблиць співзалежності використовувати і для кількісних ознак. Будь які технічні перешкоди відсутні.

Як приклад, розглянемо табл.2, в якій наведено результати соціологічного опитування населення щодо намірів прилучитися до ринку цінних паперів.

Тих, хто не боїться ризикувати, класифікували як ризикованих інвесторів; хто не уявляє ризику без гарантії – обережними; хто уникає ризику – неризикованими.

Таблиця 2

Результати соціологічного опитування про відношення до ринку цінних паперів

Вік, рокв

Тип інвестора

Разом

ризиковий

обережний

неризиковий

16-30

24

12

4

40

31-50

20

50

30

100

51 і більше

6

18

36

60

Разом

50

80

70

200

Характер розподілу частот, концентрація їх уздовж головної діагоналі свідчать про наявність стохастичного зв’язку між віком і схильністю до ризику.

Мірою тісноти стохастичного зв’язку є коефіцієнт взаємного узгодження. Його обчислення ґрунтується на розбіжностях часток умовних та безумовного розподілів і здійснюється за формулою

,

де  підсумкова частота по і–рядку

частка j–стовпця по і – рядку

частка j–стовпця безумовного розподілу.

Для сукупності в цілому  є умовних поділів.

Величину  можна обчислити, порівнюючи фактичні частоти таблиці співзалежності з теоретичними частотами (за умови незалежності ознак) , тобто

;

,

де  підсумкова частота по j-стовпцю.

За відсутності стохастичного звязку =0. При цьому частки умовних і безумовного розподілів збігаються. Збігаються також емпіричні (фактичні) та теоретичні частоти: .

На основі розподілу ймовірностей  перевіряється істотність зв”язку. Критичні значення  для= 0,05 і числа ступенів вільності  порівнюють із фактичним . Якщо , то істотність зв”язку між ознаками доведено.

Відносною мірою щільності стохастичного зв’язку слугує коефіцієнт взаємної спряженої (співзалежності).

Існує декілька варіантів його визначення. За умови, що , використовують формулу Чупрова

,

де nчисло елементів сукупності;

 - число груп за ознакою х ;

 - число груп за ознакою у.

Оскільки за відсутності стохастичного звязку (тобто, коли ознаки незалежні) =0, то і С = 0. При функціональному звязку С1. Стохастичний звязок неявний, коли 0<C<1. Якщо =, то при функціональному звязку С = 1. При ≠ навіть при функціональному звязку С <1.

У звязку з цим при ≠ використовують формулу Крамера

,

де .

Очевидно, що при = значення коефіцієнтів, обчислених за формулами Чупрова та Крамера, збігаються.

Тісноту зв’язку між двома альтернативними ознаками ==2 визначають за допомогою коефіцієнта С для чотириклітинкової таблиці, який називають коефіцієнтом асоціації або контингенції. Позначають його ще буквою А.

За змістом він ідентичний коефіціенту взаємної спряженості, а з повязаний функцією : =nА2. =nС2.

За допомогою коефіцієнта асоціації (контингенції) оцінимо тісноту зв’язку між шкідливою звичкою палити та хворобами легенів (табл.3).

Таблиця 3

Розподіл пацієнтів клініки за результатами легеневих проб.

Наявність звички палити

Результати легеневих проб

Разом

аномальні

нормальні

Палить

20

5

25

Не палить

10

15

25

Разом

30

20

50

У нашому прикладі

.

Фактичне значення =nС2=50*0,4082=8,32 перевищує критичне значення при . 0,95(1) = 3,89. Істотність звязку доведена з імовірністю Р = 0,95

Корисною мірою при аналізі 4-клітинкових таблиць взаємної спряженості є відношення перехресних добутків або відношення шансів.

.

Воно характеризує міру відносного ризику. У нашому прикладі

.

Отже, ймовірність легеневих хвороб у тих, хто палить, у 6 разів вища порівняно з тими, хто не палить.

9.2.Рангова кореляція.

При вимірюванні звязку між ознаками порядкової шкали використовується коефіцієнт рангової кореляції. Розрахунок його ґрунтується на різниці рангів , де  та  - ранги елементів сукупності відповідно за першою та другою ознаками. Його обчислюють за формулою Спірмена

де n - число елементів сукупності.

Цей коефіцієнт має такі самі властивості, як і лінійний коефіцієнт кореляції, і змінюється в межах від -1 до +1, водночас оцінює тісноту зв’язку та вказує його напрям.

При повному прямому зв’язку , тобто відхилення між рангами . Отже  і =1.

При повному зворотному звязку (ранги двох рядків розташовані у зворотньому напрямку) =-1.

Якщо два і більше елементи сукупності мають однакові значення ознаки, їм надається середній ранг. Наприклад, 2, 3 і 4 елементи сукупності мають друге за розміром значення ознаки. Тоді їм надається середній ранг 1∕3*(2+3+4) = 3, а тісноту зв’язку можна оцінити за формулою лінійного коефіцієнта кореляції.

Для прикладу використаємо дані про ранги 10 осіб згідно з їх оцінками на вступних іспитах у вуз і середніх балів за першу екзаменаційну сесію (табл.4).

Таблиця 4

Дані про ранги 10 осіб згідно з їх оцінками на вступних іспитах у вуз і середніх балів за першу екзаменаційну сесію

Студент

Ранги

d

d2

Вступні

іспити

Екзаменаційна

сесія

А

7

5

+2

4

Б

3

3

0

0

В

4

4

0

0

Г

1

2

-1

1

Д

8

9

-1

1

Е

2

1

+1

1

Ж

6

7

-1

1

З

10

10

0

0

І

5

6

-1

1

К

9

8

+1

1

Разом

55

55

х

10

=1-

Це свідчить про прямий звязок між ознаками (результатами двох екзаменів) і досить високий його рівень.

Можна перевірити істотність звязку. Критичне значення коефіцієнта рангової кореляції для =0,05 і n = 10 0,95(10) = 0,564. Фактичне значення  більше критичного. Значить істотність звязку доведена.

Для зворотних звязків, тобто коли <1, з критичним значенням порівнюється абсолютне значення .

Рангові коефіцієнти мають як переваги, так і недоліки порівняно з параметричними. Не потрібно дотримуватись певних математичних передумов відносно розподілу ознак (передумови нормальності розподілу).

Однак, оскільки використовується не значення ознаки, а ранг ознак, втрачається інформація про взаємозвязок.

Завдання.

Підсумкові результати в кросах (ранг Х) і лижній гонці (ранг У) у 10 лижників розподілились так:

Х           1   2   3   4   5   6   7   8   9   10

У           2   3   1   4   7   5  10   6   9   8

Обчислити коефіціент рангової кореляції та перевірити істотність зв”язку між результатами лижників у кросах і лижних гонках з імовірностю 0,95.

Розв язування.

Формула для .

де d=(X−Y)− відхилення рангів;

n− кількість елементів сукупності.

Розрахунки виконаємо на основі робочої табл. 1.

ρ =

Критичні значення ρ для =0,95 навед. в додатках.

Для n = 10 критичне ρ0,95 = 0,564 менше від фактичного, що свідчить про істотність зв”язку між ознаками.

Таблиця 1

Розрахункова таблиця

Ранги по кросу та лижній гонці

Різниця рангів

d = х-у

d2

Х

У

1

2

-1

1

2

3

-1

1

3

1

2

4

4

4

0

0

5

7

-2

4

6

5

1

1

7

10

-3

9

8

6

2

4

9

9

0

0

10

8

2

4

Х

Х

Х

28

Завдання

За результатами соціологічного опитування (таблю2) робітників-верстатників обчислити коефіціент асоціації.

Перевірити істотність зв язку з імовірністю 0,95.

Таблиця 2

Результати опитування

Чи задоволені ви темпами кваліф. зростання

Чи маєте намір оволодіти суміжною професією

разом

так

ні

Так

46

12

58

Ні

14

28

42

Разом

60

40

100

Розв язування.

Коефіціент асоціації А обчислюється за формулою

.

У нашому прикладі

А =

Перевірка істотності за допомогою  для  = 0,05 числа ступенів вільності К = (m1 – 1)( m2 – 1) = ( 2- 1)(2 – 1) = 1*1 = 1 становить 0,95(1) = 3,84. Фактичне значення =100*0,462 = 21,16 більше від критичного. Отже зв”язок між темпами кваліфікаційного зростання і набуттям суміжних прогресій істотний.

Завдання.

Дані комбінаційного розподілу подружніх пар за віком, років (табл.5) обчислити коефіціент співзалежності. Перевірити істотність зв”язку з імовірністю 0,95.

Таблиця 5

Комбінаційний розподіл подружніх пар

Вік дружини

Вік чоловіка

Разом

15-29

30-44

45 і більше

15-29

21

5

1

27

30-44

4

30

10

44

45 і більше

-

5

24

29

Разом

25

40

35

100

Розв язання

Оскільки число груп за обома ознаками однакове, використовують формулу співзалежності Чупрова.

,

де  - сума стандартизованих відхилень фактичних частот розподілу від теоретичних;

m1, m2 – кількість груп за 1-ою та 2-ою ознаками ;

n – кількіть елементів сукупності.

Теоритичні частоти обчислюють на основі підсумкових частот

.

 ;    і т.д.

Розрахунок  наведено у табл.6.

Таблиця 6

Розрахунок .

Група іj

-

(-)2

11

21

7

14

196

28,0

12

5

11

-6

36

3,3

13

1

9

-8

64

7,1

21

4

11

-7

49

4,5

22

30

18

+12

144

8,0

23

10

15

-5

25

1,7

31

0

7

-7

49

7,0

32

5

12

-7

49

4,1

33

24

10

+14

196

19,6

Рзом

100

100

0

х

83,3

С = .

Перевірку істотності зв”язку здійснюють за допомогою –критерію з числом ступенів вільності (m1- 1)(m2-1) = 2*2 = 4.

Критичне значення 0,95(4) = 9,49 значно менше від фактичного  = 83,3. Отже, зв”язок між віком подружжя істотний.


 

А также другие работы, которые могут Вас заинтересовать

7292. Докази і доказування у кримінальному процесі 88.49 KB
  Докази і доказування у кримінальному процесі ПЛАН: Вступ 1. Поняття, сутність та значення кримінально-процесуального доказування. 2. Предмет і суб’єкти кримінально-процесуального доказування. 3. Процес доказування у кримінальному судочинстві. 4...
7293. Основи організації і проведення заходів щодо надання допомоги потерпілим та життєзабезпечення населення 57 KB
  Тема: Основи організації і проведення заходів щодо надання допомоги потерпілим та життєзабезпечення населення. План: Мета і зміст рятувальних і невідкладних робот (РНР) Перша медична допомога Карантин і обсервація. Мета і з...
7294. Міжнародно-правове регулювання праці 75.5 KB
  Міжнародно-правове регулювання праці. План 1.Поняття та розвиток міжнародно-правового регулювання праці. 2. Всесвітні (універсальні) міжнародні стандарти праці. 3. Міжнародна організація праці та її нормотворча діяльність. 4. Європейські...
7295. Эмоции и психические состояния личности 113.5 KB
  Эмоции и психические состояния личности Вопросы для обсуждения: Общее понятий об эмоциях и чувствах. Характеристика основных форм переживаний человека. Классификация эмоций и чувств Понятие и значение психологических защит в адаптации че...
7296. Відносини власності. Тенденції розвитку відносин власності в Україні 540.5 KB
  Відносини власності План лекції Власність як економічна категорія. Структура власності, її типи, види і форми. Власність на засоби виробництва. Тенденції розвитку відносин власності в Україні. На самостійне опрацювання...
7297. Психологічні особливості підліткового віку 104 KB
  Психологічні особливості підліткового віку Загальна характеристика ситуації та особливостей розвитку підлітків Стосунки з однолітками та дорослими Розвиток пізнавальних процесів Формування особистості підлітка ЗАГАЛЬНА ХАРАК...
7298. Основи правового регулювання працевлаштування і зайнятості населення 141 KB
  Основи правового регулювання працевлаштування і зайнятості населення. Поняття зайнятості населення. Правове регулювання працевлаштування громадян України Вирішення соціальних та економічних проблем, які в сучасних умовах стоять перед Україною, з...
7299. Ділова зустріч. Умови ефективної ділової зустрічі 68 KB
  Тема: Ділова зустріч План Характеристика ділової зустрічі. Протокол ділової зустрічі. Умови ефективної ділової зустрічі. Щоб ефективно провести ділову зустріч, до неї потрібно серйозно підготуватись, продумавши все до дрібниць. Про...
7300. Мікроекономічна модель підприємства. виробнича функція 165.5 KB
  Мікроекономічна модель підприємства. виробнича функція План: Підприємство як виробнича система. Фактори виробництва та їх класифікація. Поняття i параметри виробничої функції Виробництво - це процес використання ресурсів для виготовлення ...