18398

Аналіз таблиць взаємної спряженості( співзалежності)

Лекция

Социология, социальная работа и статистика

Тема 9. Аналіз таблиць взаємної спряженості співзалежності. 9.1. Таблиці співзалежності. 9.2. Рангова кореляція. 9.1. Таблиці співзалежності. При стохастичному зв’язку кожному значенню ознаки х відповідає певна множина значень ознаки у які варіюють і утворюють ряд р

Украинкский

2013-07-08

193.5 KB

38 чел.

Тема 9. Аналіз таблиць взаємної спряженості( співзалежності).

9.1. Таблиці співзалежності.

9.2. Рангова кореляція.

9.1. Таблиці співзалежності.

При стохастичному звязку кожному значенню ознаки х відповідає певна множина значень ознаки у, які варіюють і утворюють ряд розподілу (умовний). Стохастичний звязок проявляється зміною умовних розподілів.

Розглянемо комбінаційну таблицю як результат комбінаційного розподілу господарств за двома ознаками одночасно (за урожайністю та продуктивністю праці у садівництві) (табл.1).

Таблиця 1

Комбінаційний розподіл господарств за урожайністю та продуктивністю праці

Групи за врожайністю,

ц/га

Кількість господарств за рівнем продуктивності праці, ц

Разом

до 270

270-320

320-370

370 і більше

До 70

5

1

-

-

6

70-140

-

4

5

1

10

понад 140

-

-

-

4

4

Разом

5

5

5

5

20

Побудовану таким чином табл.1 називають таблицею співзалежності (взаємної спряженості). У ній у рядках, крім підсумкового, розміщені частоти (частки) умовних розподілів господарств за рівнем продуктивності праці при фіксованому значенні урожайності (при умові, що урожайність зафіксована - умовні розподіли). Підсумковий рядок містить частоти безумовного розподілу. Порівняння частот умовних розподілів дає можливість визначити наявність стохастичного звязку. У даному випадку звязок між ознаками стохастичний, оскільки кожному значенню (інтервалу значень) ознаки х відповідає декілька значень ознаки у, а частоти розміщені та сконцентровані по діагоналі. При відсутності стохастичного зв’язку між ознаками умовні розподіли були б однакові і збігалися б з безумовним розподілом.

Методи аналітичного групування та кореляційно-регресійного аналізу використовують основні параметри розподілу - середні та дисперсії. Тому ці методи називаються параметричними.

У статистиці широко застосовуються і непараметричні методи визначення взаємозв’язків, які ґрунтуються на кількісних значеннях ознак і не потребують обчислення параметрів їх розподілів. Крім того непараметричні методи застосовуються не тільки тоді, коли ознаки (всі, як у кореляційно-регресійному аналізі, чи результативна, як у методі аналітичного групування) – ознаки метричної шкали, а й тоді, коли є ознаки порядкової (рангової ) чи номінальної шкал. Ця перевага одночасно має й недолік – досягається менша глибина аналізу взаємозв’язку: за їх допомогою визначають лише тісноту та перевіряють істотність зв’язку.

На підставі таблиць взаємної спряженості (співзалежності) аналізуються взаємозв’язки між атрибутивними ознаками. Можна методи аналізу таблиць співзалежності використовувати і для кількісних ознак. Будь які технічні перешкоди відсутні.

Як приклад, розглянемо табл.2, в якій наведено результати соціологічного опитування населення щодо намірів прилучитися до ринку цінних паперів.

Тих, хто не боїться ризикувати, класифікували як ризикованих інвесторів; хто не уявляє ризику без гарантії – обережними; хто уникає ризику – неризикованими.

Таблиця 2

Результати соціологічного опитування про відношення до ринку цінних паперів

Вік, рокв

Тип інвестора

Разом

ризиковий

обережний

неризиковий

16-30

24

12

4

40

31-50

20

50

30

100

51 і більше

6

18

36

60

Разом

50

80

70

200

Характер розподілу частот, концентрація їх уздовж головної діагоналі свідчать про наявність стохастичного зв’язку між віком і схильністю до ризику.

Мірою тісноти стохастичного зв’язку є коефіцієнт взаємного узгодження. Його обчислення ґрунтується на розбіжностях часток умовних та безумовного розподілів і здійснюється за формулою

,

де  підсумкова частота по і–рядку

частка j–стовпця по і – рядку

частка j–стовпця безумовного розподілу.

Для сукупності в цілому  є умовних поділів.

Величину  можна обчислити, порівнюючи фактичні частоти таблиці співзалежності з теоретичними частотами (за умови незалежності ознак) , тобто

;

,

де  підсумкова частота по j-стовпцю.

За відсутності стохастичного звязку =0. При цьому частки умовних і безумовного розподілів збігаються. Збігаються також емпіричні (фактичні) та теоретичні частоти: .

На основі розподілу ймовірностей  перевіряється істотність зв”язку. Критичні значення  для= 0,05 і числа ступенів вільності  порівнюють із фактичним . Якщо , то істотність зв”язку між ознаками доведено.

Відносною мірою щільності стохастичного зв’язку слугує коефіцієнт взаємної спряженої (співзалежності).

Існує декілька варіантів його визначення. За умови, що , використовують формулу Чупрова

,

де nчисло елементів сукупності;

 - число груп за ознакою х ;

 - число груп за ознакою у.

Оскільки за відсутності стохастичного звязку (тобто, коли ознаки незалежні) =0, то і С = 0. При функціональному звязку С1. Стохастичний звязок неявний, коли 0<C<1. Якщо =, то при функціональному звязку С = 1. При ≠ навіть при функціональному звязку С <1.

У звязку з цим при ≠ використовують формулу Крамера

,

де .

Очевидно, що при = значення коефіцієнтів, обчислених за формулами Чупрова та Крамера, збігаються.

Тісноту зв’язку між двома альтернативними ознаками ==2 визначають за допомогою коефіцієнта С для чотириклітинкової таблиці, який називають коефіцієнтом асоціації або контингенції. Позначають його ще буквою А.

За змістом він ідентичний коефіціенту взаємної спряженості, а з повязаний функцією : =nА2. =nС2.

За допомогою коефіцієнта асоціації (контингенції) оцінимо тісноту зв’язку між шкідливою звичкою палити та хворобами легенів (табл.3).

Таблиця 3

Розподіл пацієнтів клініки за результатами легеневих проб.

Наявність звички палити

Результати легеневих проб

Разом

аномальні

нормальні

Палить

20

5

25

Не палить

10

15

25

Разом

30

20

50

У нашому прикладі

.

Фактичне значення =nС2=50*0,4082=8,32 перевищує критичне значення при . 0,95(1) = 3,89. Істотність звязку доведена з імовірністю Р = 0,95

Корисною мірою при аналізі 4-клітинкових таблиць взаємної спряженості є відношення перехресних добутків або відношення шансів.

.

Воно характеризує міру відносного ризику. У нашому прикладі

.

Отже, ймовірність легеневих хвороб у тих, хто палить, у 6 разів вища порівняно з тими, хто не палить.

9.2.Рангова кореляція.

При вимірюванні звязку між ознаками порядкової шкали використовується коефіцієнт рангової кореляції. Розрахунок його ґрунтується на різниці рангів , де  та  - ранги елементів сукупності відповідно за першою та другою ознаками. Його обчислюють за формулою Спірмена

де n - число елементів сукупності.

Цей коефіцієнт має такі самі властивості, як і лінійний коефіцієнт кореляції, і змінюється в межах від -1 до +1, водночас оцінює тісноту зв’язку та вказує його напрям.

При повному прямому зв’язку , тобто відхилення між рангами . Отже  і =1.

При повному зворотному звязку (ранги двох рядків розташовані у зворотньому напрямку) =-1.

Якщо два і більше елементи сукупності мають однакові значення ознаки, їм надається середній ранг. Наприклад, 2, 3 і 4 елементи сукупності мають друге за розміром значення ознаки. Тоді їм надається середній ранг 1∕3*(2+3+4) = 3, а тісноту зв’язку можна оцінити за формулою лінійного коефіцієнта кореляції.

Для прикладу використаємо дані про ранги 10 осіб згідно з їх оцінками на вступних іспитах у вуз і середніх балів за першу екзаменаційну сесію (табл.4).

Таблиця 4

Дані про ранги 10 осіб згідно з їх оцінками на вступних іспитах у вуз і середніх балів за першу екзаменаційну сесію

Студент

Ранги

d

d2

Вступні

іспити

Екзаменаційна

сесія

А

7

5

+2

4

Б

3

3

0

0

В

4

4

0

0

Г

1

2

-1

1

Д

8

9

-1

1

Е

2

1

+1

1

Ж

6

7

-1

1

З

10

10

0

0

І

5

6

-1

1

К

9

8

+1

1

Разом

55

55

х

10

=1-

Це свідчить про прямий звязок між ознаками (результатами двох екзаменів) і досить високий його рівень.

Можна перевірити істотність звязку. Критичне значення коефіцієнта рангової кореляції для =0,05 і n = 10 0,95(10) = 0,564. Фактичне значення  більше критичного. Значить істотність звязку доведена.

Для зворотних звязків, тобто коли <1, з критичним значенням порівнюється абсолютне значення .

Рангові коефіцієнти мають як переваги, так і недоліки порівняно з параметричними. Не потрібно дотримуватись певних математичних передумов відносно розподілу ознак (передумови нормальності розподілу).

Однак, оскільки використовується не значення ознаки, а ранг ознак, втрачається інформація про взаємозвязок.

Завдання.

Підсумкові результати в кросах (ранг Х) і лижній гонці (ранг У) у 10 лижників розподілились так:

Х           1   2   3   4   5   6   7   8   9   10

У           2   3   1   4   7   5  10   6   9   8

Обчислити коефіціент рангової кореляції та перевірити істотність зв”язку між результатами лижників у кросах і лижних гонках з імовірностю 0,95.

Розв язування.

Формула для .

де d=(X−Y)− відхилення рангів;

n− кількість елементів сукупності.

Розрахунки виконаємо на основі робочої табл. 1.

ρ =

Критичні значення ρ для =0,95 навед. в додатках.

Для n = 10 критичне ρ0,95 = 0,564 менше від фактичного, що свідчить про істотність зв”язку між ознаками.

Таблиця 1

Розрахункова таблиця

Ранги по кросу та лижній гонці

Різниця рангів

d = х-у

d2

Х

У

1

2

-1

1

2

3

-1

1

3

1

2

4

4

4

0

0

5

7

-2

4

6

5

1

1

7

10

-3

9

8

6

2

4

9

9

0

0

10

8

2

4

Х

Х

Х

28

Завдання

За результатами соціологічного опитування (таблю2) робітників-верстатників обчислити коефіціент асоціації.

Перевірити істотність зв язку з імовірністю 0,95.

Таблиця 2

Результати опитування

Чи задоволені ви темпами кваліф. зростання

Чи маєте намір оволодіти суміжною професією

разом

так

ні

Так

46

12

58

Ні

14

28

42

Разом

60

40

100

Розв язування.

Коефіціент асоціації А обчислюється за формулою

.

У нашому прикладі

А =

Перевірка істотності за допомогою  для  = 0,05 числа ступенів вільності К = (m1 – 1)( m2 – 1) = ( 2- 1)(2 – 1) = 1*1 = 1 становить 0,95(1) = 3,84. Фактичне значення =100*0,462 = 21,16 більше від критичного. Отже зв”язок між темпами кваліфікаційного зростання і набуттям суміжних прогресій істотний.

Завдання.

Дані комбінаційного розподілу подружніх пар за віком, років (табл.5) обчислити коефіціент співзалежності. Перевірити істотність зв”язку з імовірністю 0,95.

Таблиця 5

Комбінаційний розподіл подружніх пар

Вік дружини

Вік чоловіка

Разом

15-29

30-44

45 і більше

15-29

21

5

1

27

30-44

4

30

10

44

45 і більше

-

5

24

29

Разом

25

40

35

100

Розв язання

Оскільки число груп за обома ознаками однакове, використовують формулу співзалежності Чупрова.

,

де  - сума стандартизованих відхилень фактичних частот розподілу від теоретичних;

m1, m2 – кількість груп за 1-ою та 2-ою ознаками ;

n – кількіть елементів сукупності.

Теоритичні частоти обчислюють на основі підсумкових частот

.

 ;    і т.д.

Розрахунок  наведено у табл.6.

Таблиця 6

Розрахунок .

Група іj

-

(-)2

11

21

7

14

196

28,0

12

5

11

-6

36

3,3

13

1

9

-8

64

7,1

21

4

11

-7

49

4,5

22

30

18

+12

144

8,0

23

10

15

-5

25

1,7

31

0

7

-7

49

7,0

32

5

12

-7

49

4,1

33

24

10

+14

196

19,6

Рзом

100

100

0

х

83,3

С = .

Перевірку істотності зв”язку здійснюють за допомогою –критерію з числом ступенів вільності (m1- 1)(m2-1) = 2*2 = 4.

Критичне значення 0,95(4) = 9,49 значно менше від фактичного  = 83,3. Отже, зв”язок між віком подружжя істотний.


 

А также другие работы, которые могут Вас заинтересовать

32263. Разработка грунта в траншее грейферным оборудованием для устройства «стены в грунте» 127 KB
  Схема разработки захватки траншеи за один проход грейфера представлена на рис. После разработки траншеи на полную глубину производится проверка глубины траншеи зачистка траншеи от слоя осыпавшего грунта и осадка глинистого раствора путем плавного опускания и перемещения грейфера по всей плоскости траншеи. Разработка захватки траншеи за один проход грейфера.
32264. Метод опускного колодца при строительстве сооружений водопровода и канализации 60 KB
  Сущность метода состоит в том что первоначально на поверхности земли возводят стены колодца оборудованные ножевой частью а затем внутри его разрабатывают грунт в направлении от центра к периметру стен.Первым этапом сооружения колодца является устройство основания под нож которое гарантирует надежное опирание последнего при возведении стен.По окончании устройства стен приступают к погружению колодца под действием его собственной силы тяжести.
32265. Устройство анкерного крепления котлованов 42 KB
  Грунтовые анкера относятся тоже к ограждению котлованов и применяются взамен распорной системы. Грунтовые анкера компенсируют опрокидывающий момент действующий со стороны грунта на конструкцию. Анкера располагаются за пределами котлована и как правило выходят за пределы участка застройки. Вовторых сами анкера не должны препятствовать дальнейшему городскому строительству в том числе подземному.
32267. Состав и порядок ведения исполнительной документации 143 KB
  Состав и порядок ведения исполнительной документации при осуществлении строительства реконструкции капитальном ремонте объектов капитального строительства разработан в соответствии с Градостроительным кодексом Российской Федерации иными нормативными правовыми актами Российской Федерации и обязательными требованиями технических регламентов норм и правил. В случае отсутствия технических регламентов проводится проверка соответствия выполняемых работ требованиям строительных норм и правил правил безопасности государственных стандартов...
32268. Виды вантовых покрытий 215.5 KB
  Системы с замкнутым контуром поэтому являются более экономичными. ПРЯМОУГОЛЬНЫЕ В ПЛАНЕ СИСТЕМЫ В таких зданиях применяют системы из параллельных вант или вантовых ферм; поверхность оболочки имеет цилиндрическую форму. Перед замоноличиванием швов ванты вновь натягивают гидравлическими домкратами чем создают требуемое предварительное натяжение вантовой системы. Системы могут быть однопролетными или многопролетными.
32269. ОПУСКНЫЕ КОЛОДЦЫ 79.5 KB
  Способ закрепления основных осей опускных колодцев кессонов на местности должен обеспечивать возможность проверки их положения в плане в любой момент времени опускания. Створные знаки и реперы для контроля закрепления основных осей и вертикальных отметок колодцев кессонов надлежит устанавливать за пределами участков с возможными деформациями грунта вызванными опусканием сооружения в местах безопасных в отношении размыва и оползней. Размещение в пределах призмы обрушения временных сооружений и оборудования для строительства опускных...
32270. Строительство одноэтажных промышленных зданий 57 KB
  Так при монтаже одноэтажного здания раздельным методом за первую проходку крана устанавливают все колонны; за вторую проходку подкрановые балки и подстропильные фермы с продольными связями а затем фермы и плиты покрытия; комплексный совмещенный метод. В этом случае кран двигаясь вдоль пролета монтирует все колонны а затем перемещаясь поперек пролета ведет секционный монтаж. Железобетонные колонны как правило монтируют непосредственно с транспортных средств. Предварительно доставленные на строительную площадку легкие колонны...
32271. Монтажные потоки, схемы монтажа и порядок складирования конструкций одноэтажных промышленных зданий легкого типа 104.5 KB
  Монтажные потоки схемы монтажа и порядок складированияконструкций одноэтажных промышленных зданий легкого типа Практикой выработан ряд методов монтажа строительных конструкций промышленных зданий применяемых в зависимости от требуемой последовательности производства работ конструктивной схемы возводимого здания вида монтажного и технологического оборудования сроков и порядка ввода зданий в эксплуатацию очередности поставки сборных конструкций и деталей. Одноэтажные промышленные здания легкого типа монтируют преимущественно ...