18395

Вибірковий метод

Лекция

Социология, социальная работа и статистика

Тема 6. Вибірковий метод. 6.1. Суть і переваги вибіркового спостереження. 6.2. Обчислення помилок вибірки і визначення меж інтервалу для середньої величини і частки. 6.3. Різновиди вибірок. 6.4. Багатоступеневі і багатофазні вибірки. 6.5. Визначення обсягу вибірки і способ

Украинкский

2013-07-08

205 KB

17 чел.

Тема 6. Вибірковий метод.

6.1. Суть і переваги вибіркового спостереження.

6.2. Обчислення помилок вибірки і визначення меж інтервалу для середньої величини і частки.

6.3. Різновиди вибірок.

6.4. Багатоступеневі і багатофазні вибірки.

6.5. Визначення обсягу вибірки і способи поширення вибіркових даних.

6.1. Суть і переваги вибіркового спостереження.

Вибіркові спостереження – найбільш поширений вид несуцільного спостереження. Використовується при вивченні різноманітних закономірностей суспільних явищ (використання обладнання в промисловості, попит населення і ступінь його задоволення в торгівлі, вивчення громадської думки і т.ін.).

Обстеженню підлягають не всі елементи сукупності, а лише відібрана їх частина. Переваги (в порівнянні з суцільним):

- потрібно менше коштів і часу;

- дешева статистична обробка інформації;

- більш детальне вивчення кожного елемента;

- зменшується помилка реєстрації.

При вибірковому спостереженні співвідносяться дві сукупності:

  1.  генерельна (з неї проводять вибір одиниць для обстеження);
  2.  вибіркова (її безпосередньо обстежують).

Статистичні характеристики вибіркової сукупності називаються вибірковими оцінками. Це оцінки відповідних характеристик генеральної сукупності.

На підставі вибіркових оцінок обчислюють невідомі характеристики генеральної сукупності. Вибіркові оцінки узагальнених характеристик генеральної сукупності та їх граничні помилки використовують при визначенні меж довірчих інтервалів.

Вибіркові спостереження здійснюють:

  1.  для уточнення результатів суцільного спостереження;
  2.  для перевірки правильності записів під час перепису;
  3.  коли неможливо здійснити суцільне спостереження (при визначенні якості деяких виробів).

При проведенні вибіркового спостереження необхідно дотримуватись. наукового принципу організації та проведення вибіркового спостереження. Це неупереджений, випадковий відбір елементів для обстеження з рівними можливостями для всіх елементів попасти у вибірку.

Якщо генеральна сукупність містить N елементів, а відібрати для обстеження потрібно n, то число можливих вибірок можна обчислити за формулою:

де N – кількість елементів генеральної сукупності;

n – кількість елементів, що відбираються у вибірку.

Усі вони мають однакову ймовірність   і кожна з них окремо несе у собі певну похибку, властиву факту випадкового відбору.

Оскільки вибіркова сукупність не точно відтворює склад генеральної, то вибіркові оцінки не збігаються з відповідними характеристиками генеральної сукупності. Розбіжність між ними називають помилкою репрезентативності.

Для середньої величини вона дорівнює генеральній середній мінус середня вибіркова.

Для дисперсії дорівнюєСпввіднлшенню генеральної та вибіркової дисперсій.

Для частки дорівнює різниці між генеральними і вибірковими частками і т.ін.

Умовні позначення статистичних характеристик генеральних і вибіркових сукупностей:

Обсяг сукупності                                            

Середнє значення ознаки                                                   .

Загальна дисперсія                                                         .

Середня з групових дисперсій                                         .

Міжгрупова дисперсія                                                      .

Частка елементів сукупності                         Р                        d.

Дисперсія альтернативної ознаки                = pq             = d (1 - d),

р, q – частки елементів з певними (двома протилежними) значеннями ознаки.

Частка вибіркової сукупності в генеральній   ---      D.

Помилки репрезентативності  поділяють натакі види:

- випадкові помилки – наслідок випадковості відбору елементів для дослідження і відмінностей структури генеральних і вибіркових сукупностей щодо ознак, які вивчають. Уникнути їх неможливо, але в теорії вибіркового методу, є основа математична для обчислення розміру помилок і визначення напрямків їх зменшення;

- систематичні помилки – виникають, коли при формуванні вибіркової сукупності порушений принцип випадковості. Ці помилки мають для всіх елементів сукупності односторонній напрям. Тому їх називають помилками зміщення. Дуже важливо уникнути систематичних помилок. Незміщенність – одна з властивостей будь якої вибіркової оцінки.

Питання про істотність чи неістотність помилки вибірки вирішується на основі граничних теорем ймовірностей, які описують розподіл масових випадкових явищ (теореми Бернулі, Чебишева, Ляпунова, Маркова). З їх допомогою визначають:

1) ймовірність Р, що випадкова величина не перевищить будь яке фіксоване значення, або попаде в певний інтервал Р = ;

2) межі інтервалу, до якого з певною ймовірністю належить випадкова величина х;

3) обсяг вибіркової сукупності, при якому з ймовірністю 1-α помилка вибірки не перевищує завчасно встановленого рівня.

6.2. Обчислення помилок вибірки і визначення меж інтервалу для середньої величини і частки.

Визначають середню та граничну вибіркові помилки.

Середня (стандартна) помилка вибірки – це корінь квадратний з дисперсії

.

Оскільки дисперсія вибіркових помилок у n разів менша від дисперсії ознаки в генеральній сукупності, то

,

і є середнім квадратичним відхиленням вибіркових оцінок від значення параметра в генеральній сукупності.

Граничний для певної ймовірності розмір вибіркової помилки становить

де t – квантиль нормального розподілу, який називається коефіцієнтом довіри і відповідає ймовірності Р, яку можна визначити, користуючись функцією нормального розподілу. Імовірність того, що в окремій вибірці помилка не перевищить 2, дорівнює 0,954. При Р=0,997 гранична помилка . Значення t наведені в таблиці ймовірностей розподілу помилок вибірки.

Значення t

Розподіл

Нормальний

Стьюдента

8 – 10

елементів

11 – 15

елементів

1,6

1,7

1,8

1,9

2,0

2,1

2,2

2,3

2,4

2,5

3,0

0,890

911

928

942

954

964

972

979

983

987

907

928

938

947

955

962

967

972

977

980

983

993

933

943

952

960

969

972

977

981

984

987

995

На практиці при обчисленні помилки вибірки використовують дисперсію не генеральної (бо вона невідома), а вибіркової сукупності.

У великих за обсягом вибіркових сукупностях (20 і > елементів) ці дисперсії збігаються.

Якщо вибірка малочисельна, то в формулу помилки вибірки вноситься поправка . Тоді

,

а ймовірність того, що () , визначається за таблицями розподілу Стьюдента.

У теорії вибіркового методу розглядають два способи відбору:

- повторний – здійснюється за схемою кулі, що повертається; ймовірність попасти в вибірку однакова для всіх елементів генеральної сукупності;

- безповторний – здійснюється за схемою кулі, що не повертається, ймовірність окремих елементів попасти у вибірку зростає і обсяг генеральної сукупності зменшується.

Якщо генеральна сукупність обмежена і проводиться другий спосіб, то при обчисленні помилки вибірки слід враховувати частку вибіркової сукупності в генеральній Д = . З цією метою в формулу помилки вводиться додатковий множник

Д = 

0,01

0,02

0,05

0,10

0,20

0,40

0,995

0,990

0,975

0,949

0,894

0,775

При Д  0,05  наближається до одиниці і його можна не враховувати.

Отже: розмір граничної помилки вибірки середньої величини і частки обчислюється за формулами для відбору:

повторного    ; (у великих за обсягом; якщо обсяг менше 30 одиниць, то n стає рівним (n-1);

безповторного  

При обчисленні помилки вибірки для частки р використовують дисперсію альтернативної ознаки..

На розмір граничної помилки впливають:

  1.  варіація ознаки в генеральній сукупності ;
  2.  обсяг вибірки n;
  3.  частка вибірки Д =  ;
  4.  ймовірність Р, якій відповідає квантиль t.

По-перше, чим більша варіація ознаки в генеральній сукупності, тим більша в середньому помилка вибірки. Залежність прямопропорційна.

По-друге, від обсягу вибірки залежність обернено пропорційна. Щоб зменшити помилку у 2 рази, обсяг вибірки має зрости в 4 рази.

По-третє, при безповторному відборі помилка тим помітніша, чим більша Д. Залежність пряма.

Гранична помилка вибірки для ймовірності Р – це максимальне відхилення розміру значень вибіркової оцінки від характеристики генеральної сукупності.

Можливі межі значень останьої визначають так:

 - для середньої величини;

 - для частки.

Методика вибіркового оцінювання середньої і частки.

1. Необхідно враховувати спосіб відбору (повторний чи безповторний).

2. Визначити довірчі межі середньої чи частки в залежності від ймовірності Р (р = 0,954  t = 2; р = 0,997  t = 3 і т.ін.)

- визначити граничні помилки  чи  (користуються формулами  для повторного чи безповторного відбору);

- сформувати значення можливих меж  чи Р.

У статистичному аналізі часто виникає потреба в порівнянні помилок вибірки різних ознак або однієї і тієї ж ознаки в різних сукупностях.

Такі порівняння здійснюють за допомогою коефіцієнтів варіації вибіркових оцінок.

     або    

де  - коефіцієнт варіації ознаки х.

6.3. Різновиди вибірок.

Формування вибірки – не безладний процес. Він має правила.

Правила формування вибірки:

визначається основа вибірки. Одиницею основи може бути або окремий елемент сукупності, або певне угрупування їх.

Найпростішою основою вибірки є перелік елементів генеральної сукупності, пронумерований від 1 до N, набори звітів, анкет, карт і т.ін. Сукупності, як правило, мають не одну, а низку альтернативних основ для вибірки. Правильний вибір основи забезпечує репрезентативність результатів вибіркового спостереження.

вибирається спосіб відбору елементів сукупності для обстеження. Він залежить від основи вибірки. Найчастіше використовують способи, а звідси – і аналогічні назви видів вибірок:

а) простий випадковий відбір;

б) систематичний (механічний) відбір;

(а) і б) проводять в цілому по генеральній сукупності);

в) розшарований (райований) відбір; (передбачає попередню структуризацію і незалежний відбір у кожній складовій чсатині)

г) серійний відбір;

д) моментний відбір.

Простий випадковий відбір здійснюють за допомогою жереба або таблиць випадкових чисел, використовуючи заготовлені фішки чи нумерацію всіх елементів генеральної сукупності. Іноді цей спосіб недоцільний або і неможливий.

В систематичному (механічному) відборі основа вибірки – упорядкована чисельність елементів сукупності. Вибір здійснюється через рівні інтервали. Крок інтервалу дорівнює . Його обчислюють діленням обсягу сукупності N на передбачений обсяг вибірки n. Початковий перший елемент відбору визначають як випадкове число в середині першого інтервалу. Другий – залежить від початкового і кроку інтервалу.

Так, для частки вибірки Д =  = 0,05, крок є число  =  = 20. Тобто у вибірку має попасти кожен 20 –й елемент. Наприклад, початковий елемент – випадкове число 7, то другий = 7 + 20 = 27, 3 –й = 27 + 20 = 47 і т.ін. Цей спосіб більш ефективний, ніж простий випадковий відбір, його простіше здійснити. Але є й недолік: за наявності циклічних коливань значень ознаки, цикл яких збігається з кроком інтервалу, можливе зміщення помилки. (систематична помилка).

Помилку систематичної вибірки обчислюють за формулою пристої випадкової безповторної вибірки:

Розшарований відбір враховує структуру генеральної сукупності. Передбачає попередню структуризацію генеральної сукупності і незалежний відбір елементів у кожній складовій частині.

Обсяг розшарованої вибірки дорівнює:

де  – обсяг часткової вибірки;

m – число складових частин (груп, типів, районів, тощо).

Помилка розшарованої вибірки визначається за формулою:

;

де  - середня з групових дисперсій: .

Якщо групи, на які розшарована генеральна сукупність, об’єднують „схожі” елементи, а групові середні величини помітно відрізняються, то варіація ознаки в групах буде значно меншою, ніж у цілому по сукупності. Тоді, <, і це означає що помилка вибірки розшарованого відбору порівняно з помилками вибірок  простого випадкового відбору та систематичного відбору, буде меншою.

Щоб забезпечити більшу точність розшарованого відбору необхідно:

  1.  обгрунтувати ознаку розшарування сукупності;
  2.  визначити число складових частин m;
  3.  визначити обсяг часткових вибірок n;
  4.  визначити спосіб відбору.

Зменшити варіацію ознаки при розшаруванні можна за умови, що ознака розшарування корелює з ознакою, характеристики якої оцінюються.

Відповідно до правила складання дисперсій ()

          або  ;

де  - кореляційне відношення.

Таким чином, розшарування сукупності зменшує помилку вибірки на частку 1 - . Чим тісніший зв’язок між ознаками, тим помітніше зменшуються помилки вибірки. При = 0,5, вона зменшується вдвоє, при  = 0,66 – втроє.

Способи визначення складових частин  обсягу вибіркової сукупності n:

1) найпростіший, коли всі m груп представлені однаковою кількістю елементів:

nj = .

Його застосування обмежене. Якщо nj дуже відрізняються, може виникнути ситуація, коли nj > Nj , де Nj – обсяг відповідної складової частини-j генеральної сукупності, обсяг якої дорівнює N.

2) пропорційний відбір, який передбачає однакове для всіх складових частин представництво, тобто частки dj однакові і обсяг часткової вибірки залежить від обсягу відповідної складової частини

nj = dj  Nj

3) оптимальним відносно мінімізації помилки вибірки  є відбір, пропорційний середньому квадратичному відхиленню. Для нього

.

Тут обсяг вибірки залежить від рівня варіації ознаки в окремих складових частинах генеральної сукупності. Відсутність даних про варіацію ускладнює практичну реалізацію цього способу формування вибірки.

4) Різновидом розшарованого відбору є метод квот, коли обсяг часткових вибірок nj визначається завчасно (вивчення громадської думки, ринку, тощо). Цей метод не гарантує незміщеності оцінок вибірки.

Серійний відбір полягає в тому, що одиницею основи вибірки є серія елементів, які розглядаються як єдине ціле. Якщо серія Sk потрапила до вибірки, то обстежують всі без винятку елементи серії.

Помилка вибірки серійної:

;

де  - міжсерійна дисперсія   

Помилка серійної вибірки буде меншою, ніж помилка вибірки простої випадкової чи систематичної в тому разі, якщо серії більш-менш однорідні і варіація серійних середніх незначна. Зростання міжсерійної варіації збільшує помилку вибірки.

Останнім часом у практиці вибіркових досліджень застосовують моментний відбір. Його суть: станом на певні заздалегіть визначені моменти часу фіксують наявність окремих елементів процесу. Застосовують при вивченні структури витрат робочого часу, характеристики використання обладнання тощо.

Помилка моментної вибірки обчислюється за формулою повторної випадкової вибірки ().

Оцінюються значення альтернативної ознаки.

Приклад: обстежують використання виробничого обладнання в певний момент часу. Фіксують, працює z–верстат чи ні (якщо ні, зазначають причину простою). В цеху 10 верстатів, тривалість зміни 8 годин, реєстрація використання верстатів проводилась через 0,5 год. Зроблено 160 записів (16 х 10), в 144 випадках верстат працював, в 16 – не працював. Частка працюючих верстатів 0,9; дисперсія частки 0,9 х 0,1 = 0,09. З ймовірністю 0,954 гранична помилка дорівнює   або 4,7 %.

Отже, частка працюючих верстатів за зміну становила не менше,            як 90 – 4,7 = 85,3 %.

Відносно повноти охоплення елементів сукупності моментний відбір є суцільним; він є вибірковим відносно часу, бо охоплює не весь час роботи обладнання, а лише певні моменти. При правильній організації моментного відбору забезпечують досить точні результати, швидше і з меншими витратами, ніж при суцільному спостереженні.

Застосування всіх цих методів залежить від:

  1.  мети вибіркового обстеження;
  2.  можливостей його організації і проведення.

Найбільш поширеними є комбіновані вибірки, які поєднують різні способи вибору: систематичного і серійного, розшарованого і сестиматичного, простого і серійного. Поєднання способів відбору забезпечує високу репрезентативність результатів з мінімальними грошовими та трудовими витратами на організацію та проведення досліджень.

6.4. Багатоступеневі і багатофазні вибірки.

Якісна різноманітність соціально-економічних явищ, складність і багатогранність взаємозв’язків потребують поєднання різних схем вибіркового методу, що можливо в рамках використання багатоступеневої вибірки.

Ступенів може бути два, три і більше. Кожен з них має свою відмінну від інших, основу вибірки. Відповідно поділяють і одиниці вибірки: першого, другого ступеня і т.ін.

Відрізняються на різних ступенях і повнота охоплення основи та способи відбору одиниць.

Приклад: сукупність містить К одиниць І ступеня, які складаються з М одиниць ІІ ступеня; ті в свою чергу, об’єднують Nj одиниць ІІІ ступеня (таку вибірку застосовують при обстеженні бюджету населення).

І ст.. – райони області; 40 % яких охоплюються вибіркою (Д1 = 0,4);

ІІ ст.. – с/г підприємства, 20 % відбираються із тих районів, що відібрані на першому ступені (Д2 = 0,2);

ІІ ст..- сім’ї робітників; 5 % обстежують у підприємствах, що потрапили до вибірки у ІІ ст.. (Д3 = 0,05).

Відбір елементів для безпосереднього обстеження здійснюють на останньому, ІІІ, ступені формування вибіркової сукупності. Її частка в генеральній залежить від часток вибірки на всіх ступенях.

Д=0,4*0,2*0,05=0,004

Отже обстеженню підлягає 0,4% сімей області.

Багатоступенева вибірка у порівнянні з іншими  більш ефективна і значно зменшує витрати на обстеження.

При обчисленні помилки вибірки враховуються помилки на всіх ступенях відбору. Якщо чисельність груп однакова, то середня помилка триступеневої вибірки дорівнює

,

де  - середня помилка вибірки j-ступеня;

nj – вибіркова сукупність j-ступеня.

У тому випадку, коли здійснюють обстеження не однієї, а двох і більше ознак, які відрізняються варіацією, ефективна багатофазна вибірка.

Суть багатофазної вибірки: для різних ознак формують вибіркові сукупності різного обсягу. На відміну від багатоступеневої, у багатофазній вибірці використовують для всіх ознак одну і ту саму основу вибірки при розширенні послідовно програми вибірки.

Етапи формування багатофазної вибірки:

Генеральна сукупність.

І фаза- вибіркова сукупність.

ІІ фаза – підвибірка з вибіркової сукупності І фази.

ІІІ фаза – підвибірка з вибіркової сукупності ІІ фази і т. ін.

Вибіркові оцінки кожної фази використовують як додаткову інформацію на наступних фазах. Це підвищує точність результатів вибіркового обстеження.

При організації багатофазної вибірки можливі комбінації способів і видів вибіркового спостереження. Ця вибірка може поєднуватись із багатоступеневою, а також із суцільним спостереженням.


 

А также другие работы, которые могут Вас заинтересовать

37427. АРТ-ІНВЕСТУВАННЯ: СВІТОВИЙ КОНТЕКСТ 2.29 MB
  Характеристика видів творів мистецтва та специфіка артінвестування Основними якостями через які твори образотворчого мистецтва набули популярності в інвестиційній діяльності є їх матеріальне вираження висока динаміка економічного розвитку ринку на якому вони обертаються а також їх відносно висока ліквідність в порівнянні з іншими видами творів мистецтва. Власне це і спрощує процес його обертання на артринку. Введемо поняття артінвестування – інвестиційна діяльність об’єктом якої виступають твори мистецтва. Артінвестування є одним з...
37428. Разработка системы управления работой коммерческой компании 189.05 KB
  Целью данного дипломного проекта является разработка системы управления работой коммерческой компании. Исходя из современных требований, предъявляемых к качеству работы управленческого звена коммерческой компании, нельзя не отметить, что эффективная работа его всецело зависит от уровня оснащения офиса компании электронным оборудованием, таким, как компьютеры, средства связи, копировальные устройства.
37429. ПРОЕКТИРОВАНИЕ И СОЗДАНИЕ СОВРЕМЕННОГО WEB-САЙТА 230.5 KB
  Многие Web-дизайнеры сходятся во мнении, что одна из главных проблем Web-дизайна – многообразие браузеров и платформ, каждая из которых по-разному поддерживает HTML и сценарии. С выпуском каждого нового браузера улучшаются их характеристики и возможности, но это не означает, что более ранние версии при этом исчезают. В большинстве своем люди не склонны гнаться за новейшим и лучшим. Одни довольствуются тем, что у них имеется, а другие, вероятнее всего, работают на компьютерах фирм или учреждений, которые выбрали браузеры за них.
37430. Идентификация и распознавание фальсификации товаров. Виды и способы фальсификации товаров 19.35 KB
  Идентификация – установление соответствия наименований товара, указанных на маркировке и/или в сопроводительных документах, предъявляемым к ним требованиям. Это установление соответствия конкретной продукции образцу и (или) ее описание.
37431. Экономика фирмы 879 KB
  Цели определяются при создании организации, могут измениться на протяжении её функционирования, но всегда служат ориентиром, ведущим организацию к успеху. В организации существует целая система целей, включая главную цель всей организации, цели подразделений и, наконец, личные цели работников.
37432. Анализ доходности и минимизации риска с вексельными операциями ПАО «УкрСиббанк» 92.12 KB
  ТБД автоматизированная система инвентаризации и машинного представления терминологической лексики и ее семантизации в системах машинного и человекомашинного речевого общения. Научные задачи: моделирование терминологической системы РЯ как системы подсистем построение общенаучных и общетеоретических тезаурусов исследование русской терминологии Типы традиционного использования ТБД: справочноинформационное обслуживание специалистов различных областей знания обеспечение традиционного перевода научнотехнической литературы обеспечение АСОТ...
37433. Оценка недвижимости 174.5 KB
  Оценка недвижимости - наука прикладного экономического анализа, цель которого заключается в выявлении наиболее эффективного с экономической точки зрения использования объекта, в исследовании спроса и предложения на соответствующем рынке, а также в разработке модели оценки объекта, которая прогнозировала бы наиболее вероятную цену его продажи.
37434. Разработка замкнутой (бессбросной) системы производственного водообеспечения техногенного комплекса 1.13 MB
  Результатом выполнения курсового проекта является составление замкнутой схемы производственного водообеспечения техногенного комплекса. В этой схеме исключён сброс сточных вод в водный объект и значительно уменьшен расход воды, забираемой из источника водоснабжения.
37435. Організація обліку готової сільськогосподарської продукції 239.83 KB
  Визначити, класифікувати та описати порядок оцінки готової сільськогосподарської продукції; визначити основні завдання організації обліку готової сільськогосподарської продукції; визначити нормативно-правове регулювання обліку готової сільськогосподарської продукцції; визначити особливості документування господарсьих операцій повʼязаних з випуском готової сілльськогосподарської продукції...