69222

Вибірковий метод

Лекция

Социология, социальная работа и статистика

Причини і умови застосування та організації вибіркового спостереження. Так для визначення втрат при збиранні урожаю суцільне спостереження потребує значних затрат часу та коштів а при перевірці якості продукції наприклад жирності молока схожості зерна його не можна провести...

Украинкский

2014-10-01

437 KB

3 чел.

ТЕМА 13 Вибірковий  метод.

 Суть  вибіркового  методу  та  його  переваги.

  Причини   і  умови  застосування  та  організації  вибіркового  спостереження..

  Способи  формування  вибіркової  сукупності.

 Обчислення  середньої  та  граничної  помилки  для  різних  видів  вибірки.

  Визначення   необхідного  обсягу  вибірки  та  поширення  результатів  вибірки  на  генеральну  сукупність.

Література: 138-151;,с.95-136;

Теоретичні  основи  вибіркового  методу

   За  повнотою  охоплення  одиниць  досліджуваної  сукупності  статистичне  спостереження  поділяють  на  суцільне  і  несуцільне.  Суцільне  спостереження  забезпечує  найбільш  повну  інформацію  про  загальну  кількість  одиниць  сукупності  і  дає  вірогідні  узагальнюючі  статистичні характеристики  явищ,  що  аналізуються.  Проте  здебільшого  суцільне  спостереження  недоцільне  або  його  не  можна  провести.  Так,  для  визначення  втрат  при  збиранні  урожаю  суцільне  спостереження  потребує  значних  затрат  часу  та  коштів,  а  при  перевірці  якості  продукції  

( наприклад,  жирності  молока,  схожості  зерна)  його  не  можна  провести,  оскільки  таке  обстеження  пов’язане  із  псуванням  продукції.  У  такому  разі  здійснюють  несуцільне  статистичне  спостереження.  Найбільш  поширеним  видом  несуцільного  спостереження  є  вибіркове  (репрезантативне)  спостереження.

  Вибірковим  називають  таке  спостереження,  при  якому  закономірності  і  характеристики,  властиві  якій- небуть  генеральній  сукупності,  визначають  дослідженням  деякої  її  частини.  Сукупність  математичних  засобів  і  обгрунтувань,  які  використовують  при  застосуванні  вибіркового  спостереження,  дістала  назву  вибіркового  методу.

  Теоретичною  основою  вибіркового  методу  є  закон  великих  чисел  і  теорії  ймовірності,  згідно  з  якими  відмінності  між  аналогічними  характеристиками  генеральної  та  вибіркової  сукупностей  можна  зменшити  із  збільшенням  обсягу  вибірки.  Вірогідна  оцінка  всієї  досліджуваної  сукупності  за  результатами  вибіркового  спостереження  можлива  лише  за  відповідних  умов:

  1.  кількість  відібраних  одиниць  для  спостереження  повинна  бути  досить  великою;
  2.  відбір  одиниць  для  вибіркового  спостереження  має  бути  таким,  щоб  кожна  одиниця  сукупності  мала  однакову  можливість  потрапити  у  вибірку.   

  Правильно  організоване  вибіркове  спостереження  має  кілька  істотних  переваг  перед  суцільним.  Воно  дає  змогу  дістати  потрібні  дані  з  меншими  затратами  часу  та  коштів,  тобто  є  економічнішим  порівняно  із  суцільним  спостереженням,  а  також  дає  змогу  швидше  підбивати  підсумки  і  робити  відповідні  висновки.  Тобто  воно  є  оперативнішим.  Вибіркове  спостереження  застосовують  і  тоді,  коли  суцільне  спостереження  неможливе,  наприклад,  під  час  контролю  за  якістю  продукції.  При  дослідженні  споживання  населенням,  спостереженні  сукупностей  великих  обсягів  тощо.  Іноді,  коли  помилки  реєстрації  значні,  вибіркове  спостереження  забезпечує  точніші  результати.

  У  статистичній  практиці  вибіркове  спостереження  застосовують  при  обстеженні  домогосподарств  населення,  для  обліку  цін  на  ринках,  для  визначення  втрат  при   збиранні  урожаю,  контролю  якості  продукції  тощо.  Останнім  часом  вибіркове  спостереження  широко  застосовують  при  різних  опитуваннях  громадської  думки  з  політичних,  економічних,  соціальних  і  комерційних  питань.  У  науковій  роботі  при  статистичній  обробці  результатів  досліджень.

  Вибіркове  спостереження  також  застосовують  у  поєднанні  із  суцільним  для  поглиблення  дослідження  (наприклад,  при  переписах  населення)  або  для  перевірки  результатів  суцільного  спостереження.  Так,  під  час  перепису  (обліку)  худоби  на  основі  вибірки  визначають  процент  недообліку  при  суцільному  переписі  худоби  у  населення.

  Розрізняють  генеральну  та  вибіркову  сукупності.  Генеральна  сукупність - це  загальна  сукупність  одиниць,  з  якої  проводять  відбір  частини  одиниць.  Вибіркова  сукупність - це  частина  генеральної  сукупності,  яку  вибірково  обстежують.  Обсяг  генеральної  сукупності  позначають  через  ,  а  вибіркової - через  .

  За  допомогою  вибіркового  спостереження  вивчають  середній  розмір  досліджуваної  ознаки  (наприклад,  середній  розміру  втрат  продукції  при  збиранні  урожаю)  або  частку  досліджуваної  ознаки  9наприклад,  частку  посівів,  уражених  шкідниками  та  хворобами  сільськогосподарських  культур).

  Середню  величину  та  дисперсію  ознаки  у  генеральній  сукупності  називають  генеральною  середньою  і  генеральною  дисперсією.  Генеральну  середню  позначають  через  .  А  генеральну  дисперсію - через  .

  Середню  величину  та  дисперсію  ознаки  у  вибірковій  сукупності  називають  вибірковою  середньою  і  вибірковою  дисперсією.  Вибіркову  середню  позначають  через  .  А  вибіркову  дисперсію - через  .

  Частку  одиниць,  які  мають  певні  ознаки  у  генеральній  сукупності,  називають  генеральною  часткою.  Або  просто  часткою,  а  частку  одиниць,  які  мають  певні  ознаки  у  вибірковій  сукупності,  називають  частістю.  Генеральну  частку  позначають  через    а  частість - через  

  Середня  показника  вибіркової  сукупності  визначається  за  формулою:

                                                 

дисперсія  визначається  за  формулою -  

частка  визначається  за  формулою -  

Середня  показника  генеральної  сукупності  визначається  за  формулою:

                                                       

дисперсія  визначається  за  формулою -   

частка  визначається  за  формулою -     

  Різниця  між  показниками  вибіркової  та  генеральної  сукупностей  

  становить  помилку  репрезентативності.

  Помилки  репрезентативності  виникають  тому,  що  вибіркова  сукупність  неточно  відображує  генеральну  сукупність.  Ці  помилки  характерні  для  всіх  вибіркових  спостережень,  оскільки  як  би  старанно  і  правильно  не  проводився  відбір  одиниць,  середні  та  відносні  показники  вибіркової  сукупності  завжди  будуть  якоюсь  мірою  відрізняються  від  відповідних  показників  генеральної  сукупності.  У  зв’язку  з  цим  основним  завданням  вибіркового  методу  є  одержання  таких  вибіркових  характеристик,  які  б  найбільш  точно  відображували  характеристики  генеральної  сукупності.

  Найближче  значення  шуканої  величини  генеральної  сукупності,  встановлене  на  основі  вибіркового  спостереження,  називають  статистичною  оцінкою  параметра  розподілу.  Основними  вимогами,  які  ставляться  до  статистичних  оцінок.  Є  незміщеність,  надійність,  ефективність  і  достатність.

  Незміщеною  називають  таку  статистичну  оцінку,  математичне  сподівання  (можливе  значення  генеральної  характеристики)  якої  при  будь-якому  обсязі  вибірки  дорівнює  значенню  параметра  генеральної  сукупності.  Оцінка  буде  незміщеною  у  тому  разі,  якщо  значення  вибіркової  характеристики  збігається  із  значенням  генеральної  характеристики.  Якщо  ж  вибіркова  характеристика  або  менша або  більша   за  генеральну,  то  оцінка  буде  зміщеною.

  Надійною  називають  таку  статистичну  оцінку,  яка  грунтується  на  законі  великих  чисел,  тобто  із  збільшенням  кількості  спостережень  вона  наближається  до  свого  математичного  сподівання.  Надійність  оцінки  означає,  що,  чим  більша  чисельність  вибірки,  тим  вища  ймовірність,  що  помилка  оцінки  не  перевищить  скільки  завгодно  малої  величини.

  Ефективно  називають  таку  незміщену  оцінку,  яка  має  найменшу  дисперсію  серед  усіх  можливих  незміщених  оцінок  параметра,  обчислених  за  вибірками  того  самого  обсягу.  Вона  характеризує  якісний  бік  вибіркових  характеристик:  з  двох  оцінок  ефективною  буде  та,  яка  матиме  найменшу  помилку.

  Оцінку  називають  достатньою,  якщо  вона  забезпечує  повноту  використання  всієї  інформації  про  невідому  характеристику  генеральної  сукупності,  яка  міститься  у  вибірці.

 У  теоретичному  курсі  математичної  статистики  доводиться,  що  вибіркова  середня  арифметична  є  незміщеною,  надійною,  ефективною  та  достатньою  оцінкою  генеральної  середньої,  а  вибіркова  дисперсія  є  найкращою  оцінкою  генеральної  дисперсії.  Математична  надійність  вибіркової  дисперсії  не  дорівнює  дисперсії  генеральної  сукупності.  Через  це  вибіркова  дисперсія  є  зміщеною  оцінкою  генеральної  дисперсії.  При  цьому  помилка  зміщення  дорівнює  .  Чим  менша  вибірка,  тим  більше  помилка.

  Для  того  щоб  усунути  помилку  зміщення,  вибіркову  дисперсію  коригують  на  поправочний  коефіцієнт  (поправка  Бесселя):

         

де   - виправлена  вибіркова  дисперсія;

      - фактична  вибіркова  дисперсія;

        - вибіркова  середня  арифметична;

        - вибіркова  сукупність.

  Математична  надійність  виправленої  дисперсії  при  будь-якому  обсязі  вибірки  дорівнює  генеральній  дисперсії.

  Невідомий  параметр  генеральної  сукупності  можна  оцінити  одним  числом  (точкою)  або  деяким  інтервалом,  в  якому  з  певною  ймовірністю  може  міститися  шуканий  параметр.  У  зв’язку  із  цим  розрізняють  два  способи  оцінки  параметрів  генеральної  сукупності:  точкову  та  інтервальну  оцінки.

  Суть  точкової  оцінки  полягає  в  тому.  Що  за  певний  параметр  генеральної  сукупності  беруть  знайдене  за  вибіркою  його  числове  значення,  тобто  шуканий  параметр  оцінюють  одним  числом.  Так  вибіркова  середня  є  незміщеною  та  найбільш  ефективною  точковою  оцінкою  генеральної  середньої,  а  вибіркова  виправлена  дисперсія - незміщеною  точковою  оцінкою  генеральної  дисперсії.

  Оскільки  вибіркова  оцінка  є  випадковою  величиною  і  має  імовірний  характер,  то  числову  характеристику  слід  доповнити  величиною  середньої  помилки.  Середня  помилка  показує  можливі  відхилення  характеристик  вибіркової  сукупності  від  характеристик  генеральної  сукупності.  Розмір  помилки  оцінки  залежить  від  величини   дисперсії.  Чим  менша  дисперсія,  тим  менша  помилка  оцінки  і  тим   надійніші  статистичні  висновки.

  Теоретично  з  кожної  генеральної  сукупності  можна  сформувати  всі  можливі  вибірки,  тобто  можливі  поєднання  одиниць  генеральної  сукупності  при  встановленій  чисельності  вибірок.  Якщо  генеральна  сукупність  містить   елементів,  а  для  обстеження  потрібно  вибрати  з  них  частину  ,  то  число  можливих  вибірок  визначається  за  формулою:

                                     

  Усі  вони  мають  однакову  ймовірність    але  кожна  з  них  несе  в  собі  певну  похибку,  що  відбиває  факт  випадковості  вибору.  Оскільки  помилки  вибіркового  спостереження  носять  випадковий  характер,  то  вони  можуть  мати  різні  значення.  

  Для  узагальнюючої  характеристики  помилки  вибірки  визначають  середню  помилку.  Середня  помилка  вибірки - це  середнє  квадратичне  відхилення  вибіркових  середніх  від  середньої  генеральної  сукупності.  У  теорії  ймовірності  доведено,  що  квадрат  середньої  помилки,  тобто  дисперсія  вибіркових  середніх,  прямо  пропорційний  дисперсії  ознаки  в  генеральній  сукупності  і  обернено  пропорційний  чисельності  вибірки:

                                        

  Звідси  формула  для  визначення  середньої  помилки  вибірки  матиме  такий  вигляд:

                                          або  

  Наведена  формула  свідчить,  що  чим  більша  чисельність  вибірки,  тим  менший  розмір  можливої  помилки  і,  навпаки,  чим  більший  рівень  варіації  досліджуваної  ознаки  у  генеральній  сукупності,  тим   більший  розмір  можливої  помилки.

  Отже,  якщо  середня  обчислена  за  вибірковими  даними,  то  її  відхилення  від  генеральної  середньої  дорівнюватиме    Обчислення  середньої  помилки  у  вибірковій  сукупності  визначається  так:

                                       

  Якщо  вибіркове  спостереження  застосовують  для  визначення  частки  досліджуваної  ознаки,  то  середню  помилку  вибірки  обчислюють  за  формулою:

                                        

  де   - дисперсія  альтернативної  ознаки.

  Середню  помилку  вибірки  використовують  для  визначення  можливих  відхилень  показників  вибіркової  сукупності  від  відповідних  показників  генеральної  сукупності.  Однак  можна  стверджувати,  що  генеральні  показники  не  виходять  за  межі  середньої  помилки  вибірки  не  з  абсолютною  вірогідністю,  а  лише  з  певним  ступенем  ймовірності.  У  зв’язку  з  цим  поряд  із  середньою  помилкою  (точковою  оцінкою)  визначають  граничну  помилку  вибірки,  тобто  дається  інтервальна  оцінка  параметрів  генеральної  сукупності.

     Інтервальною  називають  оцінку,  яка  визначається  двома  числами - кінцями  інтервалу.  В  якому  із  встановленою  імовірністю  містить  шуканий  параметр.  Центром  такого  інтервалу  звичайно  є  вибіркова  оцінка  точки,  а  визначення  меж  інтервалу  пов’язане  із  середньою  помилкою  оцінки  та  надійною  ймовірністю.  Отже,  інтервальна  оцінка  є  доповненням  і  розширенням  точкової  оцінки  відповідного  параметра.  Якщо  при  точковій  оцінці  надійність  висновку  пов’язана  тільки  з  середньою  помилкою,  то  при  інтервальній  оцінці - з  граничною  помилкою.

  Конкретна  помилка    -  різниця  між  показниками  вибіркової  та  генеральної  сукупностей)  кожної  вибірки  може  мати  різні  значення.  Проте  якщо  вибіркова  сукупність    досить  велика  і  розподілена  нормально,  то  її  відношення  до  середньої  помилки  здебільшого  не  перевищує    ця  залежність  між  граничною  та  середньою  помилками  у  статистиці  дістала  назву  правила  трьох  сигм.

  Відношення  помилки  вибірки  до  середньої  помилки  називають  нормованим  відхиленням  і  позначають  через  

                                 

  Підставивши  у  формулу  нормованого  відхилення  значення    матимемо:

                                

  Нормоване  відхилення  використовують  як  коефіцієнт  надійності,  який  показує,  з  якою  імовірністю  можна  твердити  про  значення  граничної  помилки.

  Гранична  помилка - це    разів  узята  середня  помилка:

                               

де  m - середня  помилка  вибірки;

      t - нормоване  відхилення  (коефіцієнт  надійності).

  Нормоване  відхилення  залежить  від  ймовірності,  з  якою  можна  гарантувати  певні  розміри  граничної  помилки.  Ймовірність - це  міра  об’єктивної  можливості  здійснення  певних  подій.  Кількісно  ймовірність  виражають  відношенням  кількості  сприятливих  наслідків  до  кількості  можливих  наслідків.  Якщо  кількість  сприятливих  наслідків  дорівнює  нулю,  то  ймовірність    також  дорівнює  нулю.  Якщо  кількість  сприятливих  наслідків  дорівнює  всім  можливим  наслідкам,  то  ймовірність  дорівнює  одиниці.  Отже,  ймовірність  може  мати  значення  від  0  до  1.

  Теоретичне  обгрунтування  формули  граничної  помилки  вибірки  наведено  у  відомій  теоремі  П. Л. Чебишева  з  доповненнями  О.М. Ляпунова.  Ця  теорема  формулюється  так:  при  досить  великій  кількості  незалежних  спостережень  з  імовірністю,  як  завгодно  близько  до  одиниці,  можна  твердити,  що  вибіркова  середня  буде  як  завгодно  мало  відрізнятися  від  генеральної  середньої.

  Стосовно  вибіркового  спостереження,  при  якому  вивчається  середнє  значення  ознаки,  цю  теорему  можна  записати  так:

                               

де  p - ймовірність;

    ф - функція.

  Для  вибіркового  спостереження,  при  якому  вивчається  частка  досліджуваної  ознаки,  ця  формула  матиме  такий  вигляд:

                                

  Наведена  формула  виражає  таку  залежність:  з  імовірністю,  як  завгодно  близько  до  одиниці,  можна  твердити,  що  при  досить  великій  кількості  незалежних  спостережень  частіше  буде  як  завгодно  мало  відрізнятись  від  частки.

  Теоретичні  величини  t  і  p,  обчислені  на  основі  стандартної  кривої  нормального  розподілу,  наведено  в  спеціальних  таблицях  «Значення  інтеграла  імовірностей  при  різних  значеннях  t»,  можна  визначити  ймовірність  або,  навпаки,  на  основі  певної  ймовірності  визначити  величину  t .  у  таблиці  на  перетині  рядків  і  граф  розміщується  значення  ймовірності,  які  відповідатимуть  певному  значенню  t.  Оскільки  в  таблиці  всі  значення  ймовірності  збільшені  в  10000  разів,  то  до  табличного  значення  p  потрібно  дописувати  «нуль  цілих».  Так  при    ймовірність  р  дорівнює  0,9545.  Це  означає,  що  з  імовірністю  0,9545  можна  гарантувати,  що  розмір  граничної  помилки  не  перевищить  двократної  середньої  помилки,  тобто  висновок  про  розмір  граничної  помилки  вибірки  буде  правильним  у  9545  випадках  із  10000.  в  останніх  455  випадках  фактична  помилка  може  бути  більшою  за  встановлені  розміри.

  За  даними  таблиці  визначають  і  величину  t  при  відповідному,  достатньому  для  кожного  конкретного  випадку,  рівні  ймовірності.

  Результати  вибіркового  спостереження  можна  оцінити  з  різним  рівнем  ймовірності.  Рівень  ймовірності,  який  беруть  при  обчисленні  помилки  вибіркового  спостереження,  називають  гарантованим.  У  статистичній  практиці  достатнім  рівнем  ймовірності  вважається  р=0,95.  це  означає,  що  тільки  у  5  випадках  із  100  помилка  може  перевищувати  встановлені  розміри.

  При  більш  суворому  підході  до  оцінки  результатів  і  вищій  вимогливості  до  надійності  висновків  рівень  ймовірності  підвищується  до  0,99,  а  в  особливо  відповідальних  випадках  (наприклад,  при  оцінці  ефективності  нових  пестицидів) - 0,999.

  Можливий  і  інший  підхід  до  інтерпретування  результатів  вибіркового  спостереження,  зокрема  при  оцінці  ймовірності  того,  що  знайдені  під  час  вибіркового  спостереження  розбіжності є  випадковими,  неістотними.  У  такому  разі  визначають  величину  1-р,  яку  називають  рівнем  істотності.

  Рівень  істотності  показує  ймовірність,  з  якою  гіпотеза,  що  перевіряється,  може  дати  помилковий  результат.  Уважається  достатнім  рівень  істотності  0,05  (або  5 %  рівень),  а  в  більш  відповідальних  спостереженнях - 0,01  і  навіть  0,001  (або  відповідно  1 %  і  0,1 %  рівень).

  На  основі  граничної  помилки  будується  надійний  інтервал.  Інтервальна  оцінка  параметра:

                                         

а  надійний  інтервал  має  вигляд:

                                         

де   - значення  генеральної  характеристики;

      - значення  вибіркової  характеристики;

     - гранична  помилка  вибірки.

  При  вибірковому  спостереженні  не  можна  обчислити  генеральну  дисперсію  .  У  звязку  із  цим  її  замінюють  вибірковою  

дисперсією  ,  враховуючи,  що  співвідношення  між  ними  визначають  за  такою  формулою:

                          ,  звідси  

  Якщо  вибіркова  сукупність  має  велику  кількість  спостережень,  то  величина    наближається  до  1  і  цю  поправку  можна  не  враховувати.  В  цьому  разі  вважається,  що  обчислена  вибіркова  дисперсія  достатньо  точно  характеризує  варіацію  ознаки  в  генеральній  сукупності.  Використання  поправочного  коефіцієнта    не  змінює  знайдених  результатів.

 Розмір  середньої  помилки   (граничної  помилки  та  надійного  інтервалу)  при  використанні  вибіркової  дисперсії  залишається  таким  самим,  як  і  при  використанні  генеральної  дисперсії.

Способи  формування  вибіркових  сукупностей  і  статистична  оцінка  вибіркових  характеристик

  Важливою  умовою  наукової  організації  вибіркового  спостереження  є  правильне  формування  вибіркової  сукупності.  Для  одержання  вірогідних  даних  вибірка  повинна  достатньо  точно  відображувати  основні  характеристики  генеральної  сукупності.

  Вибіркову  сукупність,  яка  достатньо  точно  відображує  генеральну  сукупність,  називають  репрезентативною.  Щоб  вибірка  правильно  відображувала  генеральну  сукупність,  вона  повинна  охоплювати  потрібну  кількість  одиниць  спостереження,  а  процес  формування  вибірки  слід  організувати  так,  щоб  забезпечити  однакову  можливість  кожній  одиниці  генеральної  сукупності  потрапити  у  вибіркову  сукупність.

  За  способом  відбору  одиниць  для  спостереження  розрізняють  такі  види  формування  вибіркової  сукупності:  власне  випадкову,  механічну,  серійну  і  типову  вибірки.

  Власне  випадковою  називають  таку  вибірку,  при  якій  кожна  одиниця  з  генеральної  сукупності  відбирається  у  вибірку  випадково,  ненавмисно.  При  цьому  генеральна  сукупність  не  розподіляється  на  складові  частини.  Відбір  одиниць  звичайно  проводиться  жеребкуванням.

  На  практиці  застосовують  два  різновиди  власне  випадкової  вибірки:  повторний  і  безповторний.  При  повторній  вибірці  кожна  раніше  відібрана  одиниця  знову  повертається  в  генеральну  сукупність  і  може  знову  брати  участь  у  вибірці.  Цей  вид  вибірки  забезпечує  незалежність  наступних  витягів  від  попередніх,  оскільки  склад  генеральної  сукупності  незмінний.

  При  безповторний  вибірці  кожна  раніше  відібрана  одиниця  не  повертається  в  генеральну  сукупність  і  у  дальшому  відборі  не  Бере  участі.  Отже,  при  повторній  вибірці  окрема  одиниця  сукупності  може  потрапити  у  вибірку  кілька  разів,  а  при  безповторній - тільки  один  раз.  Безповторна  вибірка,  як  правило,  дає  точніші  результати,  ніж  повторна.

  Результати  власне  випадкової  вибірки  оцінюють  за  такими  формулами:

-  при  визначенні  середнього  розміру  ознаки

                                     - повторна  вибірка;

                         - безповторна  вибірка;

-  при  вивченні  частки

                                    - повторна  вибірка;

                        - безповторна  вибірка.

 Як  зазначалося,  при  проведенні  вибіркового  спостереження  даних  про  розмір  дисперсії  (середнього  квадрата  відхилень)  у  генеральній  сукупності  немає.  У  зв’язку  з  цим  замість  них  використовують  вибіркову  дисперсію,  скориговану  при  невеликій  кількості  спостережень  на  коефіцієнт  

  Формула  помилки  при  безповторній  вибірці  відрізняється  від  відповідної  формули  при  повторній  вибірці  тільки  множником  .  

Це  зумовлене  тим,  що  при  безповторній  вибірці  відібрані  одиниці  не  повертаються  у  генеральну  сукупність  і  її  чисельність  поступово  зменшується.  Якщо  процент  вибірки  невеликий,  то  відношення    є  невелике  число,  а  різниця    мало  чим  відрізняється  від  одиниці.  У  такому  разі  цей  множник  можна  не  враховувати  і  граничну  помилку  вибірки  визначити  за  формулами  повторної  вибірки.

  

  Спочатку  визначимо  середню  у  вибірковій  сукупності:

          

Вибіркова  дисперсія:

         

  Оскільки  помилка  вибірки  може  мати  додатній  або  відємний  знак,  то  можливі  межі  середньої  величини  у  генеральній  сукупності  визначають  за  формулою:

                              або  .

  Механічна  вибірка  є  різновидом  випадкової  вибірки.  При  ній  одиниці  для  вибіркового  спостереження  відбирають  не  жеребкуванням,  а  механічно  через  відповідний  інтервал.  Для  цього  всі  одиниці  генеральної  сукупності  розподіляють  у  певному  порядку,  Але  так,  щоб  порядок  не  був  пов’язаний  з  розміром  досліджуваної  ознаки.  Наприклад,  сукупність  населених  пунктів  можна  розташувати  за  географічним  положенням,  працівників - за  алфавітом  прізвищ,  однойменні  товари - в  міру  їх  виробництва  чи  надходження  тощо.

  Якщо  загальна  чисельність  генеральної  сукупності  2000  одиниць,  а  потрібно  сформувати  вибірку  з  200  одиниць,  то  для  вибіркового  спостереження  відбирають  кожну  десяту  одиницю:

                                           

  Розподіливши  одиниці  генеральної  сукупності  у  певному  порядку  (за  алфавітом,  у  зростаючому  чи  спадаючому  порядку)  навмисно  або  за  допомогою  жеребкування  в  першій  десятці  визначають  початкову  одиницю  відбору,  наприклад  5.  після  цього  для  вибіркового  спостереження  відбирають  5,  15,  25-ту  і  т.д.  одиниці.

  Механічну  вибірку  застосовують  при  відборі  домогосподарств  для  бюджетних  обстежень,  при  відборі  населених  пунктів  для  контрольних  обходів  з  метою  уточнення  результатів  обліку  худоби,  при  контролі  якості  продукції  і  т.д.  недоліком  цього  виду  відбору  є  те,  що  для  його  застосування  потрібно  мати  повний  облік  одиниць  генеральної  сукупності.

  Механічна  вибірка  завжди  безповторна.  Оцінку  середньої  (при  t=1)  і  граничної  помилок  здійснюють  за  тими  самими  формулами,  що  й  при  власне  випадковій  вибірці.

Розглянемо  такий  приклад.

При проведення 5% механічної вибірки дістали дані про врожайність нового сорту пшениці,  наведені  в  таблиці  №

Таблиця  №

Урожайність, ц/га

20-22

22-24

24-26

26-28

28-30

Всього

Посівна площа, га

18

22

32

16

12

100

Визначимо середню помилку репрезентативності:

1)при встановленні середньої очікуваної врожайності нового сорту пшениці;

2) при визначенні питомої ваги посівної площі нового сорту пшениці урожайність якої перевищує 26 ц/га .

Для нашої вибірки середня врожайність нескладно  знаходиться   за  формулою  середньої  арифметичної  зваженої:ц/га

Дисперсія.

Розрахунок  дисперсії  виконували за  формулою  За умовою. Оскільки маємо 5% вибірку, то обсяг   вибірки  

Тоді

Отже,   

2) Питома вага посівної площі з врожайністю більше 26 ц/га:

 

Тоді середня помилка репрезентативності становить:

 

Отже питома вага посівної площі, на якій врожайність перевищуватиме 26 ц/га, становить 28% 4%.

  При  серійній  (гніздовій)  вибірці  для  спостереження  відбирають  не  окремі  одиниці  генеральної  сукупності,  а  серії  (гнізда)  таких  одиниць.  Відбір  серій  проводять  власне  випадковим  або  механічним  способом.  У  відібраних  серіях  обчислюють  усі  одиниці  без  винятку.

  Загальне  число  серій,  що  становлять  генеральну  сукупність,  розглядається  при  серійний  вибірці  як  її  загальна  чисельність  ,  а  кількість  відібраних  серій - як  чисельність  вибірки  .  Визначаючи  помилки  серійної  вибірки,  враховують  тільки  варіацію  ознаки  між  окремими  серіями,  так  звану  міжсерійну  варіацію.  Результати  серійної  вибірки  оцінюють  за  такими  формулами:

-  при  визначенні  середнього  розміру  ознаки

                                 -  повторна  вибірка;

                                 -  безповторна  вибірка;

-  при  визначенні  частки  ознаки

                                 -  повторна  вибірка;

                                 -  безповторна  вибірка.

де    - міжсерійна  (міжгрупова)  дисперсія;

        - частість  ознаки  в  середньому  у  всіх  обстежених  серіях;

       - загальна  чисельність  рівновеликих  серій  у  генеральній      

сукупності;

      nc  - чисельність  серій,  відібраних  для  обстеження.

  Переваги  серійної  вибірки  в  тому,  що  відбирати  і  обстежувати  групи  одиниць  значно  простіше,  ніж  окремі  одиниці.  Проте  в  зв’язку  з  тим,  що  при  цьому  відборі  порушується  рівномірність  розподілу  одиниць   вибіркової  сукупності  і  всій  сукупності,  серійна  вибірка,  як  правило,  дає  більш  високу  помилку  вибірки.  Для  того ,  щоб забезпечити  більш  високу  точність  вибірки,  слід  збільшувати,  порівняно  з  іншими  видами  відбору,  її  чисельність.  Прикладом  серійної  вибірки  можуть  бути  контрольні  10%  обходи,  Які  проводять  після  перепису  худоби  в  господарствах  населення.

 При  типовій  ( районованій)  вибірці)  всю  генеральну  сукупність  після  попереднього  аналізу  розподіляють  на  однорідні  типові  групи ,  райони,  зони,  за  певними  ознаками.  Потім  з  кожної  групи  у  випадковому  або  механічному  порядку  відбирають  певну  кількість  одиниць  у  вибіркову  сукупність.   При   цьому  кількість  відібраних  з  кожної  групи  одиниць  пропорційна  чисельності  груп  або  середнім  квадратичним  відхиленням  усередині  типових  груп.

Типова  вибірка  дає  точний  результат  порівняно  з  іншими  вилами  відбору,  тому  що  розподіл  генеральної  сукупності  на  типові  групи  забезпечує  попадання  у   вибірку  одиниць,  які  належать  до  різних  типових  груп.

  Репрезентативність  типової  вибірки  залежить  від  того,  наскільки  точно  відображують  кожну  типову  групу  відібрані  одиниці. Точність  типової  вибірки  для   всієї  сукупності  залежить  від  варіації  ознаки  всередині    окремих  груп,  оскільки  загальна  варіація  при  розподілі  сукупності    на  типові  групи  зменшується  на   величину  між групової  варіації.  Через  це  при  визначенні  помилки  типової  вибірки  для  середнього  розміру  ознаки  беруть  не  загальну    дисперсію,  а    середню  із  часткових   (групових) дисперсій.   Так  само  при  визначенні  помилки  вибірки  для  частки  ознаки  замість  добутку  w(1-w)   беруть  середню  з  групових  добутків    w(1-w) .

  Результати  типової  вибірки  оцінюють  за  такими  формулами:  

При  визначенні  середнього  розміру  ознаки  

  

                              -  повторна  вибірка;

  

                            - безповторна  вибірка;

-  при  визначенні  частки

                                    - повторна  вибірка;

                        - безповторна  вибірка;

   Типову  вибірку  часто  проводять  кількома  стадіями,  ступенями.  При  цьому кожна  стадія  має  свою  одиницю  відбору.  Така  вибірка  називається  багатоступінчастою.  Особливістю  багатоступінчастої  вибірки  є  те,  що  спочатку  з  генеральної  сукупності  відбирають  частину  одиниць,  а  потім  з  цієї   частини   формують  вибірку  другого  порядку ,  яку  і  аналізують.  За  двоступінчатою  вибіркою  здійснюють  аналіз  якості  насіння.  Спочатку  відбирають  проби  з  партії  насіння,  а  потім  з  відібраного  насіння  виділяють  наважку  для  визначення  схожості,  чистоти  й  інших  посівних  якостей  насіння. За  двоступінчастою  схемою  формують  вибірки  для  аналізу  якості    продукції.  Прикладом  триступінчастої  вибірки може  бути  обстеження  особистих  господарств  населення,  при  якому  спочатку  відбирають   адміністративні  районів  окремих  регіонах  України ,  потім  сільські  (міські) ради,  а  в  них – господарства.  

   При  проведенні  вибіркового  спостереження  важливо  знати ,  наскільки  точно   вибіркова  сукупність  відображує (репрезентує)    генеральну  сукупність.  Для  цього  порівнюють  відомі  та  найбільш  важливі  показники  генеральної  сукупності   (середнє  значення  ознаки,  частку,  дисперсію, середнє  квадратичне  відхилення)  з  відповідними  показниками  вибіркової  сукупності.  Показник  репрезентативності   вибірки  визначають  як  відношення  вибіркової  характеристики  до  відповідної  характеристики  генеральної  сукупності.    На  практиці   відбір  вважають  задовільним,  якщо  показник  репрезентативності відбору  лежить  в  межах  від  95  до  105  %.  Якщо  показник  репрезентативності  виходитиме  за  ці  межі,  то  відбір  вважається  незадовільним і  його  потрібно  повторити.  Якщо  і  повторний  відбір  буде  незадовільним,  то  слід  збільшити  чисельність  вибірки.

  Коли  показники  вибірки  досить  точно  репрезентують  генеральну  сукупність,  можна  досконало  вивчити    тільки  вибіркову  сукупність,  уважаючи,  що  знайдені  дані  вірогідно  характеризуватимуть  сукупність  у  цілому.

  Заключним  етапом  вибіркового  спостереження  є  поширення  його  результатів  на всю  генеральну  сукупність,  тобто  визначення  генеральних  показників  за  вибірковими  даними.  Розрізняють  два  способи  поширення:  спосіб  перерахування  і  спосіб  коефіцієнтів.

   При  прямому  перерахуванні  вибіркову  середню  ознаки  або  частість  множать  на  чисельність  одиниць  генеральної  сукупності  .

  Припустимо,  що  середньорічний  надій  молока  від  однієї  корови  для  вибіркової  сукупності  становить  4000 кг ,  а  середньорічна  кількість  корів  в  особистих     господарствах   населення    району – 2000  голів.  Звідси  валовий  надій  молока  в  особистих  господарствах  населення  дорівнюватиме  40*2000=80  тис.  ц.  якщо при  цьому  відомо,  що  гранична  помилка  вибірки  з  імовірністю  р=0,95  дорівнює  кг,  то  середньорічний  надій  молока  від  корови  у  генеральній  сукупності  коливатиметься  від  3880  до  4120  кг,  а   валовий  надій  молока -  від  77,6  до  82,4 тис. ц.

   Спосіб  коефіцієнтів  застосовують  для  уточнення  даних  суцільного  спостереження.  При  цьому,  порівнюючи  дані  вибіркового  спостереження  з  даними  суцільного  спостереження,  обчислюють  поправочний  коефіцієнт,  яким  і  користуються  для  внесення  поправок  у  матеріали  суцільного  спостереження.  Так,  за  даними  суцільного  обліку  в  особистих  господарства  населення  було  зареєстровано  1910  корів.  Контрольними  обходами  було  охоплено  10%  дворів,  у   яких  зареєстровано   210  корів,  а  за  даними  суцільного  обліку  налічувалось  200  корів.  У  цьому  разі  поправочни1й  коефіцієнт   дорівнюватиме  210:200=1,05,  а  фактичне  поголів’я  корів  в  особистих  господарствах  населення  з  поправкою  на  недооблік  -  1910*1,05=2005.

Визначення  потрібної   чисельності  вибірки

   При  організації  вибіркового  спостереження,  особливо  коли  воно  проводиться  вперше,  важливо  правильно  визначити  чисельність  вибіркової  сукупності.  Якщо  спостереженню  підлягає  недостатня  кількість  одиниць,  то  знайдені  результати  будуть  неточними  і  тоді  можна  зробити   необгрунтовані  висновки  про  середній  розмір  або  частку  ознаки  у  генеральній  сукупності.   Якщо  відбирається  занадто  велика  кількість  одиниць,  то  це  призводить  до  зайвих  затрат  праці  та  коштів,  а  при  контролі  за  якістю  продукції  (  схожості  насіння,  жирності  молока,  структури  метала)  -  до  зайвих  втрат.

   Чисельність  вибіркової  сукупності  залежить  від  способу  відбору  одиниць  для  спостереження,  рівня  варіації  досліджуваної  ознаки,  розміру  граничної  помилки  вибірки,  а  також  рівня  ймовірності,  з  якою  потрібно  гарантувати  результати  вибіркового  спостереження.  Формули  для  визначення  потрібної  чисельності  вибірки   виводяться  з  формул  граничних  помилок ,  а  саме  при  визначенні  розміру  ознаки:

- власне  випадкова  повторна  вибірка;

- власне  випадкова  та  механічна  без повторна  вибірка;

 - серійна   безповторна  вибірка;

- типова  безповторна  вибірка.

   При  практичному  застосуванні  формул  для  визначення  обсягу  вибірки  також  немає  даних  про  варіацію  досліджуваної  ознаки  в  генеральній  сукупності.  При  цьому,  якщо  у  формулі  для  визначення  помилки  вибірки  генеральну  дисперсію  можна  замінити  скоригованою     випадковою  дисперсією,  то  у  формулі  для  визначення  чисельності  вибірки   цього  зробити  не  можна,  скільки  обсяг  вибірки    слід  визначати  до  початку проведення  вибіркового  спостереження.  Для  цього  замість  фактичних  даних  генеральної  дисперсії  беруть  дані  попередніх  спостережень,  або  проводять  пробні  обстеження    і  на  їх  основі  визначають  орієнтовні  розміри  дисперсії.    Наприклад,  перед  тим  як  приступити  до  визначення  втрат  врожаю  гороху ,  потрібно  визначити  кількість  метрівок  (  квадратних  рамок  площею  1 м. кв.) ,  які  слід  накласти  на  полі  площею   100га.  При  цьому  ставиться  умова,  щоб  з  імовірністю  0,95  помилка  не  перевищила  0,3ц/га.  Для  визначення  очікуваної  варіації  втрат  врожаю  під  час  збирання  гороху проведено  пробне  обстеження ,  під  час  якого  встановлено,  що  дисперсія  втрат  дорівнює 4 г/см кв. (0,4 ц/га).  Метрівки  накладають  по  діагоналі  за  способом  механічної   безповторної  вибірки.  Звідси  потрібну  чисельність  вибірки  визначають  за  формулою

.

  Оскільки  чисельність  генеральної  сукупності  N  дорівнює  100га  або

1  млн.  метрів  квадратних,  тобто  є  настільки  великою,  що  розрахунки  можна  вести  за  формулою  для  повторної  вибірки,  то  

             =   метрівок.                         

  Отже  з  імовірністю  помилитися  лише  в  5  випадках  із  100  можна стверджувати,  що  коли  буде  накладено  17  метрівок,  то  втрати  під  час  збирання  гороху  будуть  визначені  з  точністю     ц/га.

  Якщо  вибірку  здійснюють  з  невеликою  за  чисельністю  генеральної сукупності,  її  обсяг  визначають  за  формулою  для  без повторної  вибірки.  Наприклад,  потрібно  розрахувати  чисельність  вибірки  для  визначення  середньої  живої  маси  поросят  при  відлученні  у  селянському  господарстві  з  помилкою  не  більше   як  1  кг.  Середнє  квадратичне  відхилення  живої  маси  поросят  при  відлученні  в  господарстві   дорівнює  близько  2  кг,  загальна  кількість  поросят  N= 40,  рівень  ймовірності  р=0,95.  Звідси

  =

  

  Отже  з  ймовірністю  0,95  можна  гарантувати,  що  коли  буде  відібрано  для  обстеження  у  випадковому  порядку  11  голів,  то  жива  маса  поросят  при  відлученні  буде  визначена з  точністю      кг.

 Для  частки  ознаки   в  сукупності   дисперсію  визначають  так :  беруть  максимальне  значення   дисперсії  альтернативної  ознаки  0,25 (якщо  р= 0,5,  то  р(1-р)=0,5*0,5=0,25).

  При  визначенні  потрібної  чисельності  вибірки  помилку  часто  обчислюють  у  процентах.  У  цьому  разі  варіювання  досліджуваної  ознаки  слід  також  виразити   у  відносних  величинах  і  дисперсію  замінити  коефіцієнтом  варіації.

  Коли  вибіркове  спостереження  проводять  для  визначення  середніх   і  відносних  показників  кількох  ознак,  потрібно  встановити  таку   чисельність  вибірки,  яка  забезпечила  б  результати  за  всіма  ознаками.

Мала  вибірка

   Щоб  вибіркова  сукупність  правильно  відображувала  генеральну  сукупність ,  вона  повинна охоплювати  достатню  кількість  одиниць  спостереження.  Чим  більше  одиниць  спостереження  включає  вибірка,  тим  правильнішим  буде  висновок  про  розмір  ознаки  у  генеральній  сукупності.  Однак  на  практиці  не  завжди  доцільно  одержувати  великі  вибіркові  сукупності.  Так,  при  перевірці  якості  продукції  в  дослідній  справі  обмежуються  порівняно  невеликими  за  обсягом  вибірковими  сукупностями.

  Вибірки,  чисельність  яких  не  перевищує  20  одиниць  спостереження,  називають  малими  вибірками.  Невеликий  обсяг  малої  вибірки  деякою  мірою  знижує  ї  точність  порівняно  з  звичайною  вибіркою,  чисельність  якої  перевищує  20  одиниць  спостереження.

   Проте  математична  статистика  розробила  способи,  які  дають  змогу  вірогідно  оцінювати  результати  малої  вибірки і  поширювати  їх  на  генеральну  сукупність.  При  цьому  розрахунок  середньої  та  граничної  помилок  має  деякі  особливості.  При  великому  обсязі  вибіркової  сукупності  (n) cпіввідношення  між  генеральною  та  вибірковими  дисперсіями  матиме  такий  вигляд:

.

Якщо  вибіркова  сукупність  досить  велика,  то  множник    наближається  до одиниці.  Так,  при  n=100 : =1,01,  при  n=200:    =  1.005 ,       при    n=500:    =  1.002  і вибіркова  дисперсія  збігається  з  генеральною.   У  невеликих  за  обсягом  сукупностях,  де  кількість  елементів  менша  двадцяти  цей  множник  слід  обов’язково  врахувати,  тому  дисперсію  в  малих  вибірках  обчислюють  за  такою  формулою:    ,  де     -1   -  кількість  ступенів  свободи  варіації.

   Під  ступенем  свободи  варіації  розуміють  кількість  варіантів,  які  можуть  мати довільні  значення ,  не  змінюючи їх   загальної  характеристики  (середньої).  Наприклад,  є  дані  трьох  спостережень:  =9,=11,=16.  звідси  

  При  трьох  спостереженнях  вільно  варіюючи  величин  залишається  тільки  дві,  тому  що  третю  можна  визначити  з  відомих  двох  величин  і  середньої.  Якщо  відомі  величини   ,,  то  величину    визначають  як  різницю  .

  Результати  малої  вибірки  за  допомогою  критеріїв  стандартної  нормальної  кривої    (як  при  звичайній   вибірці)  оцінити  не  можна,  оскільки  при   невеликій  кількості  спостережень  розподіл  ймовірностей  для  середньої  значною  мірою  залежить  від  характеру  розподілу  індивідуальних  величин.

   Основи  теорії  малої  вибірки  розробив  англійський  математик  Вільям  Госсет  (псевдонім  Стьюдент).  Дослідження  В.  Госсета  показали ,  що  при  невеликій  кількості  спостережень  середнє  квадратичне  відхилення  вибіркової  сукупності  значно  відрізняється  від  середнього  квадратичного  відхилення  генеральної  сукупності.  У  зв’язку  з  цим  використання  кривої  нормального  розподілу  для  оцінки  даних  малої  вибірки  дає  приблизні  результати.

  В.Госсет  обґрунтував  закон  розподілу   відхилень  вибіркових  середніх  від  генеральної  середньої  для  малих  вибірок.  Згідно  з  цим  законом  імовірна  оцінка  того,  що  гранична  помилка  не  перевищить t – кратну  середню  помилку  в  малих  вибірках ,  залежить  не  тільки  від  значення t,  а  й  від  обсягу  вибірки.

   Теоретично  нормоване  відхилення  для  малих  вибірок  дістало назву  t- критерію  Стьюдента  на  відміну  від  критерію  t –нормального  розподілу,  який  застосовують  для  великих  вибірок.  Із  збільшенням  обсягу  вибірки  розподіл  Стьюдента  наближається  до  нормального  розподілу.  

  На  основі    встановленої  закономірності  розподілу  помилок  малих  вибірок  складено  спеціальні  таблиці,  в  яких  наведено значення  критерію  t – Стьюдента  і  відповідних  рівнів  ймовірності  при різній  чисельності  одиниць  вибірки.  Наприклад,  при  t=2  і  п’яти  ступенях  свободи  рівень  ймовірності  помилки  становитиме  0,884.  це  означає,  що  у  884  випадках   із  1000  визначена  помилка   вибірки   не  перевищуватиме   встановлених  розмірів. В  останніх  116  випадках  фактична  помилка  може  бути  більшою  за  встановлені  розміри.  

  У  таблиці  « Значення  критерію  t – Стьюдента  при  рівні  ймовірності  0,10;  0,05;  0,01» (дод.2) наведено  розмір  критерію  t  при  встановленому  рівні  ймовірності  і  відповідній  кількості  ступенів  свободи  варіації.  Наприклад,  при  5  ступенях  свободи  і  рівні  ймовірності  0,05  теоретичне  значення  критерію  t  дорівнює 2,5706.   це  означає,  що  тільки  в  5  випадках  із  100значення  нормованого  відхилення    t  через  випадкові  причини  може  перевищити  зазначену  величину    (2,5706),  а  в  інших  випадках  воно  буде  меншим  або  таким,  як  у  таблиці.  Іншими  словами ,  табличне  значення  показує  максимальну  величину  відношення  випадкових   помилок  до  їх  середньої  помилки.

 Порівняння  таблиць  ймовірностей  нормального  розподілу  та  розподілу  Стьюдента  показує,  що  при  n=20  і  більше   вони  майже  не  відрізняються.  Так,  при   t  =1 ймовірність  дорівнює  у  великих  вибірках  0,683,  у  малих -   0,670,  при  t =2  відповідно   -  0,954  і  0,940,  при   t =3   -

0,997  і  0,992.

  Малі  вибірки  дають  неточні  результати  порівняно  із  звичайними  вибірками.  Тому  їх  рідко  застосовують  для  встановлення  дійсної  величини  середнього  розміру  або  частки  ознаки  в  генеральній  сукупності.  Малі  вибірки  використовують  в  основному  для  оцінки  ймовірності   розбіжності  розбіжностей  між  показниками  вибіркових  сукупностей,  наприклад,  при  порівнянні  дослідних  даних  про  урожайність  сільськогосподарських  культур  і  продуктивність  тварин,  визначення  розміру  втрат  під  час  збирання  урожаю  на  двох  ділянках  тощо.

Застосування  вибіркового  методу  до  дослідження  заробітної плати  робітників  та помилки  типової  вибірки  при  досліджуванні  ваги  відливок  циліндрів.

   Розглянемо  порядок  обчислення  граничних  помилок  вибіркового  спостереження  на  такому  прикладі.

На  підприємстві  вибрано  50  робітників  і  проведено  дослідження  їх  заробітної  плати.  Результати  дослідження  наведено  в  таблиці.

Таблиця  1  Розподіл  робітників  за  заробітною  платою

Заробітна   плата,  грн

Кількість  робітників

470-480

6

480-490

11

490-500

19

500-510

10

510-520

4

    З  імовірністю  0,95  визначимо  середню  заробітну  плату  робітників  підприємства  і  частку  робітників  заробітна  плата  яких  500  грн  і  вище.

Спочатку  визначимо  середню  заробітну  плату  робітників  у  вибірковій  сукупності:

Вибіркова  дисперсія  заробітної  плати  

  Скоригуємо  вибіркову  дисперсію  на  множник :

   За  таблицею  «значення  інтегралу  ймовірності»  встановимо,  що  при  рівні  ймовірності  0,95  нормоване  відхилення  (коефіцієнт  надійності) – t=1,96.

   Отже  у  нашому  прикладі ;  ;  ;  ;.

  Підставимо  ці  дані  у  формулу  граничної  помилки  вибірки  при  без повторній  вибірці,  одержимо:

=1,96=2,92

Визначимо  межі  середньої  величини  у  генеральній  сукупності:

491,08

   Отже  з  імовірністю  0,95  можна  гарантувати,  що  різниця  між  вибірковою  середньою  та  генеральною  середньою не  перевищить2.92 грн,  а  середня  заробітна  плата  робітників  знаходиться  в  межах  від  491,08грн  до  496,92грн.

Частка  робітників  ,  які  мають  заробітну  плату  500грн  і  вище  у  вибірковій  сукупності  становить .

   Скоригована  дисперсія  альтернативної  ознаки  дорівнює  

  Гранична  помилка  частки  робітників  заробітна  плата  яких  500грн  і  вище дорівнює:

 або  6,1%.

 

 Обчислимо  можливі  межі  частки  у  генеральній  сукупності:

28,0-6,1

21,9

   Отже,  з  імовірністю  0,95  можна  стверджувати  ,  що  різниця  між  частістю  і  часткою  не  перевищить  0,060,  а  частка  робітників,  заробітна  плата  яких  500  грн  і  вище  лежить  в  межах  від  21.9%  до  34.1%.

Обчислення  граничної  помилки  вибіркового  спостереження  при  типовій  вибірці  розглянемо  на  такому  прикладі.  Для  обстеження  продукції  ливарного  заводу  з  кожної  дільниці  в  лабораторію  відбирають  відливки  гільз  циліндрів  для аналізу ваги, структури  металу,  його   хімічного  складу  тощо.  З  кожної  дільниці  за  принципом  випадкової  безповторної  вибірки  відібрали  5%  відливок.  Кількість  та  вага  відібраних  відливок  наведені  в  таблиці  2.

Таблиця  2  Вихідні  та  розрахункові  дані  для  визначення  помилки  типової  вибірки

дільниця

Кількість  виготовлених  відливок

Вибіркова  сукупність

Сума

квадратів

Квадрат  суми

Середній квадрат  суми

Кількість

відливок

Загальна  вага

Середня  вага

№1

71

7

112,7

16,1

1818,93

12701,29

1814,47

№2

80

8

140,0

17,5

2451,50

19600,00

2450,00

№3

92

9

165,6

18,4

3065,16

27423,36

3047,04

№4

88

9

170,01

18,9

3223,61

28934,01

3214,89

№5

69

7

145,6

20,8

3035,16

21199,36

3028,48

разом

400

40

734,0

18,4

13594,36

-

13554,88

Обчислимо  загальну  дисперсію:

.

Обчислимо  між групову  дисперсію:

Середня  залишкова  дисперсія  становить  різницю  між  загальною  і  між груповою  дисперсіями:

=1,30-0,31=0,99.

Скоригуємо  вибіркову  залишкову  дисперсію  на  множник  :  :

  Візьмемо  рівень  ймовірності 0,95  (нормоване  відхилення  дорівнює 1,96)  і  обчислимо  граничну  помилку  при  без повторній  вибірці:

   Отже  з  імовірністю  помилитися  лише  в  5  випадках  із  100  можна  стверджувати,  що  середня  вага  відливок  у  генеральній  сукупності  знаходиться  в  межах  від  18,1  до  18,7  кг.


 

А также другие работы, которые могут Вас заинтересовать

73080. Позитивистские и эволюционные концепции культуры: Г.Спенсер, Э.Тайлор 33.5 KB
  В 19 веке появилась специальная наука об человеческих общностях социология ставшая основой для формирования культурной антропологии социологии культуры и более частных культурологических дисциплин – культурной этнологии и этнографии социологии искусства и т.
73081. Теории развития культуры в эпоху Просвещения. Д.Вико и И.Гердер 36.5 KB
  Просветителей интересовала возможность духовного совершенствования человека, взаимопонимания народов. Эти идеи оказали значительное влияние на развитие общественной мысли. Вместе с тем в 19-20 вв. идеология Просвещения нередко подвергалась критике за идеализацию человеческой природы...
73082. РЕЧЕВЫЕ АКТЫ В СТАНДАРТНОЙ ТЕОРИИ 90 KB
  Речевой акт в понимании Дж. Остина Первой своей задачей при создании теории речевых актов Дж. Остин считал выяснение характера отношений между констативными и перформативными высказываниями и условий удачности перформативов.
73083. Социальная философия и теоретическая социология 272 KB
  В противоположность кайресу следует обозначить состояние которе метафорически можно назвать исторической дремотой сном истории. Сон истории -– это период когда как кажется ничего не происходит. Это и есть ритм истории. Факторы исторического процесса и их соотношение...
73084. Вывод (доказательство) в логике 31.5 KB
  Вывод доказательство в логике: вывод и вывод из данных формул в аксиоматическом исчислении высказываний прямое и косвенное доказательство в системах естественного вывода. Доказательство логическая форма мысли обосновывающая истинность того или иного положения посредством других положений...
73085. Политика снижения рождаемости, ее результативность в разных странах 23.47 KB
  Политика одного ребёнка на одну семью (или одна семья — один ребёнок) — демографическая политика Китая. Китай был вынужден законодательно ограничить размер семьи в 1970-х годах, когда стало понятно, что огромное количество людей перегружает земельные, водные и энергетические ресурсы страны.
73086. Демографическая ситуация в экономически развитых странах мира (на примерах Европейских стран, Североамериканских, Тихоокеанских) 23.59 KB
  Население планеты постоянно растет. Самые быстрые темпы роста численности населения по-прежнему сохраняются в группе из 50 наименее развитых стран: 95% всего прироста численности населения мира приходится на данные регионы, и лишь 5% — на более развитые.
73088. Темпы роста населения мира. Модель Мальтуса 18.56 KB
  Томас Мальтус родился 13 февраля 1766 года в имении Рукери, Доркинг (английское графство Суррей), близ города Гилдфорд, в состоятельной дворянской семье. Отец учёного, Дэниел Мальтус, был последователем Давида Юма и Жан-Жака Руссо (с обоими он был лично знаком).