18398

Аналіз таблиць взаємної спряженості( співзалежності)

Лекция

Социология, социальная работа и статистика

Тема 9. Аналіз таблиць взаємної спряженості співзалежності. 9.1. Таблиці співзалежності. 9.2. Рангова кореляція. 9.1. Таблиці співзалежності. При стохастичному зв’язку кожному значенню ознаки х відповідає певна множина значень ознаки у які варіюють і утворюють ряд р

Украинкский

2013-07-08

193.5 KB

38 чел.

Тема 9. Аналіз таблиць взаємної спряженості( співзалежності).

9.1. Таблиці співзалежності.

9.2. Рангова кореляція.

9.1. Таблиці співзалежності.

При стохастичному звязку кожному значенню ознаки х відповідає певна множина значень ознаки у, які варіюють і утворюють ряд розподілу (умовний). Стохастичний звязок проявляється зміною умовних розподілів.

Розглянемо комбінаційну таблицю як результат комбінаційного розподілу господарств за двома ознаками одночасно (за урожайністю та продуктивністю праці у садівництві) (табл.1).

Таблиця 1

Комбінаційний розподіл господарств за урожайністю та продуктивністю праці

Групи за врожайністю,

ц/га

Кількість господарств за рівнем продуктивності праці, ц

Разом

до 270

270-320

320-370

370 і більше

До 70

5

1

-

-

6

70-140

-

4

5

1

10

понад 140

-

-

-

4

4

Разом

5

5

5

5

20

Побудовану таким чином табл.1 називають таблицею співзалежності (взаємної спряженості). У ній у рядках, крім підсумкового, розміщені частоти (частки) умовних розподілів господарств за рівнем продуктивності праці при фіксованому значенні урожайності (при умові, що урожайність зафіксована - умовні розподіли). Підсумковий рядок містить частоти безумовного розподілу. Порівняння частот умовних розподілів дає можливість визначити наявність стохастичного звязку. У даному випадку звязок між ознаками стохастичний, оскільки кожному значенню (інтервалу значень) ознаки х відповідає декілька значень ознаки у, а частоти розміщені та сконцентровані по діагоналі. При відсутності стохастичного зв’язку між ознаками умовні розподіли були б однакові і збігалися б з безумовним розподілом.

Методи аналітичного групування та кореляційно-регресійного аналізу використовують основні параметри розподілу - середні та дисперсії. Тому ці методи називаються параметричними.

У статистиці широко застосовуються і непараметричні методи визначення взаємозв’язків, які ґрунтуються на кількісних значеннях ознак і не потребують обчислення параметрів їх розподілів. Крім того непараметричні методи застосовуються не тільки тоді, коли ознаки (всі, як у кореляційно-регресійному аналізі, чи результативна, як у методі аналітичного групування) – ознаки метричної шкали, а й тоді, коли є ознаки порядкової (рангової ) чи номінальної шкал. Ця перевага одночасно має й недолік – досягається менша глибина аналізу взаємозв’язку: за їх допомогою визначають лише тісноту та перевіряють істотність зв’язку.

На підставі таблиць взаємної спряженості (співзалежності) аналізуються взаємозв’язки між атрибутивними ознаками. Можна методи аналізу таблиць співзалежності використовувати і для кількісних ознак. Будь які технічні перешкоди відсутні.

Як приклад, розглянемо табл.2, в якій наведено результати соціологічного опитування населення щодо намірів прилучитися до ринку цінних паперів.

Тих, хто не боїться ризикувати, класифікували як ризикованих інвесторів; хто не уявляє ризику без гарантії – обережними; хто уникає ризику – неризикованими.

Таблиця 2

Результати соціологічного опитування про відношення до ринку цінних паперів

Вік, рокв

Тип інвестора

Разом

ризиковий

обережний

неризиковий

16-30

24

12

4

40

31-50

20

50

30

100

51 і більше

6

18

36

60

Разом

50

80

70

200

Характер розподілу частот, концентрація їх уздовж головної діагоналі свідчать про наявність стохастичного зв’язку між віком і схильністю до ризику.

Мірою тісноти стохастичного зв’язку є коефіцієнт взаємного узгодження. Його обчислення ґрунтується на розбіжностях часток умовних та безумовного розподілів і здійснюється за формулою

,

де  підсумкова частота по і–рядку

частка j–стовпця по і – рядку

частка j–стовпця безумовного розподілу.

Для сукупності в цілому  є умовних поділів.

Величину  можна обчислити, порівнюючи фактичні частоти таблиці співзалежності з теоретичними частотами (за умови незалежності ознак) , тобто

;

,

де  підсумкова частота по j-стовпцю.

За відсутності стохастичного звязку =0. При цьому частки умовних і безумовного розподілів збігаються. Збігаються також емпіричні (фактичні) та теоретичні частоти: .

На основі розподілу ймовірностей  перевіряється істотність зв”язку. Критичні значення  для= 0,05 і числа ступенів вільності  порівнюють із фактичним . Якщо , то істотність зв”язку між ознаками доведено.

Відносною мірою щільності стохастичного зв’язку слугує коефіцієнт взаємної спряженої (співзалежності).

Існує декілька варіантів його визначення. За умови, що , використовують формулу Чупрова

,

де nчисло елементів сукупності;

 - число груп за ознакою х ;

 - число груп за ознакою у.

Оскільки за відсутності стохастичного звязку (тобто, коли ознаки незалежні) =0, то і С = 0. При функціональному звязку С1. Стохастичний звязок неявний, коли 0<C<1. Якщо =, то при функціональному звязку С = 1. При ≠ навіть при функціональному звязку С <1.

У звязку з цим при ≠ використовують формулу Крамера

,

де .

Очевидно, що при = значення коефіцієнтів, обчислених за формулами Чупрова та Крамера, збігаються.

Тісноту зв’язку між двома альтернативними ознаками ==2 визначають за допомогою коефіцієнта С для чотириклітинкової таблиці, який називають коефіцієнтом асоціації або контингенції. Позначають його ще буквою А.

За змістом він ідентичний коефіціенту взаємної спряженості, а з повязаний функцією : =nА2. =nС2.

За допомогою коефіцієнта асоціації (контингенції) оцінимо тісноту зв’язку між шкідливою звичкою палити та хворобами легенів (табл.3).

Таблиця 3

Розподіл пацієнтів клініки за результатами легеневих проб.

Наявність звички палити

Результати легеневих проб

Разом

аномальні

нормальні

Палить

20

5

25

Не палить

10

15

25

Разом

30

20

50

У нашому прикладі

.

Фактичне значення =nС2=50*0,4082=8,32 перевищує критичне значення при . 0,95(1) = 3,89. Істотність звязку доведена з імовірністю Р = 0,95

Корисною мірою при аналізі 4-клітинкових таблиць взаємної спряженості є відношення перехресних добутків або відношення шансів.

.

Воно характеризує міру відносного ризику. У нашому прикладі

.

Отже, ймовірність легеневих хвороб у тих, хто палить, у 6 разів вища порівняно з тими, хто не палить.

9.2.Рангова кореляція.

При вимірюванні звязку між ознаками порядкової шкали використовується коефіцієнт рангової кореляції. Розрахунок його ґрунтується на різниці рангів , де  та  - ранги елементів сукупності відповідно за першою та другою ознаками. Його обчислюють за формулою Спірмена

де n - число елементів сукупності.

Цей коефіцієнт має такі самі властивості, як і лінійний коефіцієнт кореляції, і змінюється в межах від -1 до +1, водночас оцінює тісноту зв’язку та вказує його напрям.

При повному прямому зв’язку , тобто відхилення між рангами . Отже  і =1.

При повному зворотному звязку (ранги двох рядків розташовані у зворотньому напрямку) =-1.

Якщо два і більше елементи сукупності мають однакові значення ознаки, їм надається середній ранг. Наприклад, 2, 3 і 4 елементи сукупності мають друге за розміром значення ознаки. Тоді їм надається середній ранг 1∕3*(2+3+4) = 3, а тісноту зв’язку можна оцінити за формулою лінійного коефіцієнта кореляції.

Для прикладу використаємо дані про ранги 10 осіб згідно з їх оцінками на вступних іспитах у вуз і середніх балів за першу екзаменаційну сесію (табл.4).

Таблиця 4

Дані про ранги 10 осіб згідно з їх оцінками на вступних іспитах у вуз і середніх балів за першу екзаменаційну сесію

Студент

Ранги

d

d2

Вступні

іспити

Екзаменаційна

сесія

А

7

5

+2

4

Б

3

3

0

0

В

4

4

0

0

Г

1

2

-1

1

Д

8

9

-1

1

Е

2

1

+1

1

Ж

6

7

-1

1

З

10

10

0

0

І

5

6

-1

1

К

9

8

+1

1

Разом

55

55

х

10

=1-

Це свідчить про прямий звязок між ознаками (результатами двох екзаменів) і досить високий його рівень.

Можна перевірити істотність звязку. Критичне значення коефіцієнта рангової кореляції для =0,05 і n = 10 0,95(10) = 0,564. Фактичне значення  більше критичного. Значить істотність звязку доведена.

Для зворотних звязків, тобто коли <1, з критичним значенням порівнюється абсолютне значення .

Рангові коефіцієнти мають як переваги, так і недоліки порівняно з параметричними. Не потрібно дотримуватись певних математичних передумов відносно розподілу ознак (передумови нормальності розподілу).

Однак, оскільки використовується не значення ознаки, а ранг ознак, втрачається інформація про взаємозвязок.

Завдання.

Підсумкові результати в кросах (ранг Х) і лижній гонці (ранг У) у 10 лижників розподілились так:

Х           1   2   3   4   5   6   7   8   9   10

У           2   3   1   4   7   5  10   6   9   8

Обчислити коефіціент рангової кореляції та перевірити істотність зв”язку між результатами лижників у кросах і лижних гонках з імовірностю 0,95.

Розв язування.

Формула для .

де d=(X−Y)− відхилення рангів;

n− кількість елементів сукупності.

Розрахунки виконаємо на основі робочої табл. 1.

ρ =

Критичні значення ρ для =0,95 навед. в додатках.

Для n = 10 критичне ρ0,95 = 0,564 менше від фактичного, що свідчить про істотність зв”язку між ознаками.

Таблиця 1

Розрахункова таблиця

Ранги по кросу та лижній гонці

Різниця рангів

d = х-у

d2

Х

У

1

2

-1

1

2

3

-1

1

3

1

2

4

4

4

0

0

5

7

-2

4

6

5

1

1

7

10

-3

9

8

6

2

4

9

9

0

0

10

8

2

4

Х

Х

Х

28

Завдання

За результатами соціологічного опитування (таблю2) робітників-верстатників обчислити коефіціент асоціації.

Перевірити істотність зв язку з імовірністю 0,95.

Таблиця 2

Результати опитування

Чи задоволені ви темпами кваліф. зростання

Чи маєте намір оволодіти суміжною професією

разом

так

ні

Так

46

12

58

Ні

14

28

42

Разом

60

40

100

Розв язування.

Коефіціент асоціації А обчислюється за формулою

.

У нашому прикладі

А =

Перевірка істотності за допомогою  для  = 0,05 числа ступенів вільності К = (m1 – 1)( m2 – 1) = ( 2- 1)(2 – 1) = 1*1 = 1 становить 0,95(1) = 3,84. Фактичне значення =100*0,462 = 21,16 більше від критичного. Отже зв”язок між темпами кваліфікаційного зростання і набуттям суміжних прогресій істотний.

Завдання.

Дані комбінаційного розподілу подружніх пар за віком, років (табл.5) обчислити коефіціент співзалежності. Перевірити істотність зв”язку з імовірністю 0,95.

Таблиця 5

Комбінаційний розподіл подружніх пар

Вік дружини

Вік чоловіка

Разом

15-29

30-44

45 і більше

15-29

21

5

1

27

30-44

4

30

10

44

45 і більше

-

5

24

29

Разом

25

40

35

100

Розв язання

Оскільки число груп за обома ознаками однакове, використовують формулу співзалежності Чупрова.

,

де  - сума стандартизованих відхилень фактичних частот розподілу від теоретичних;

m1, m2 – кількість груп за 1-ою та 2-ою ознаками ;

n – кількіть елементів сукупності.

Теоритичні частоти обчислюють на основі підсумкових частот

.

 ;    і т.д.

Розрахунок  наведено у табл.6.

Таблиця 6

Розрахунок .

Група іj

-

(-)2

11

21

7

14

196

28,0

12

5

11

-6

36

3,3

13

1

9

-8

64

7,1

21

4

11

-7

49

4,5

22

30

18

+12

144

8,0

23

10

15

-5

25

1,7

31

0

7

-7

49

7,0

32

5

12

-7

49

4,1

33

24

10

+14

196

19,6

Рзом

100

100

0

х

83,3

С = .

Перевірку істотності зв”язку здійснюють за допомогою –критерію з числом ступенів вільності (m1- 1)(m2-1) = 2*2 = 4.

Критичне значення 0,95(4) = 9,49 значно менше від фактичного  = 83,3. Отже, зв”язок між віком подружжя істотний.


 

А также другие работы, которые могут Вас заинтересовать

30158. Формирование и анализ фирменного стиля туристской фирмы «Астрагал» в городе Орехово-Зуево 147 KB
  Дата государственной регистрации ОАО Гостиница Обь : 21. Основные товарные позиции ОАО Гостиница Обь на рынке г. Основной хозяйственной деятельностью ОАО Гостиница Обь являются гостиничные услуги. Доля доходов ОАО Гостиница Обь от оказания гостиничных услуг в общих доходах по состоянию 01.
30160. ТАМОЖЕННО-ТАРИФНОЕ РЕГУЛИРОВАНИЕ В РАМКАХ ФУНКЦИОНИРОВАНИЯ ТАМОЖЕННОГО СОЮЗА 1023.5 KB
  Таможенно-тарифное регулирование отличается от других регуляторов тем, что оно имеет внерыночный характер и реализуется только непосредственно государством. В отличие от него другие регуляторы испытывают на себе воздействие, как рыночных сил, так и государства. Например, цены в том или ином секторе экономики могут формироваться под воздействием конкурентной или монопольной среды.
30161. Анализ финансово- хозяйственной деятельности ООО «РИМ» 190.96 KB
  1 Характеристика предприятия 3. Предложения по улучшению финансово хозяйственной деятельности ООО РИМ Заключение Список использованных источников ВВЕДЕНИЕ В условиях рыночной экономики финансы предприятия приобретают особенно важное значение для существования и развития предприятия. Искусство управления финансами предприятия все в большей мере сосредотачивается на использовании внутреннего потенциала предприятия на экономическом обосновании принимаемых управленческих решений что в свою очередь требует совершенствования приемов и методов...
30162. Учет расчетов с персоналом по оплате труда на примере ООО «Азимут» 153.33 KB
  Теоретические основы учета расчетов с персоналом по оплате труда. Сущность и основные понятия организации расчетов по оплате труда. Формы и системы оплаты труда 1. Состав и методы формирования фонда оплаты труда 2.
30163. Особенности организации учета расходов на НИОКР на предприятии ООО «Сатурн» 214 KB
  Цель курсовой работы – раскрыть основные особенности бухгалтерского учета расходов на НИОКР на примере конкретного предприятия, в соответствии с законодательными и нормативными актами и обозначить проблемы, с этим связанные.
30164. Розрахунок ультразвукового термометра 12.93 MB
  Переваги ультразвукових термометрів особливо яскраво проявились при їх випробовуванні та експлуатації в реакторних і енергетичних установках, що зумовило інтенсифікацію досліджень в області ультразвукової термометрії.
30165. Совершенствование технологии возделывания ячменя и кормовой свеклы 152.12 KB
  Наиболее плодородными являются суглинистые почвы занимающие 257 площади пашни. Также неплохими агрономическими свойствами обладают супесчаные почвы подстилаемые суглинками. В процессе жизненного цикла растения ярового ячменя проходят следующие фазы роста и развития: Прорастание семян Всходы Кущение Выход в трубку Колошение Цветение Формирование и созревание зерна Химический состав зерна ярового ячменя зависит от вида и сорта от плодородия почвы погодноклиматических условий и агротехники. при влажности почвы менее 30 полной...
30166. Реконструкция системы водоснабжения с.Исмаилово Дюртюлинского района Республики Башкортостан 249.46 KB
  Кроме того потребители воды люди животные машины при выполнении многих производственных операций пахота уборка пастьба животных и др. Все это усложняет водоснабжение увеличивает дальность транспортирования воды затрудняет эксплуатацию систем. Это обусловливает цикличное чередование сельскохозяйственных работ а следовательно неравномерность потребления воды.