36130

СТАТИСТИКА. Лекційні заняття

Конспект

Социология, социальная работа и статистика

Ознака яка набуває в межах сукупності різних значень називається варіюючою змінною мінливою а відмінність коливання ознаки варіацією. Наприклад ознаки людини: вік стать сімейний стан освіта тощо; ознаки підприємства: спеціалізація форма власності рентабельність виробництва і т. За характером вираження ознаки поділяють: Атрибутивні – ознаки окремі значення яких виражаються словами. Кількісні – ознаки окремі значення яких виражаються числами вік людини розряд робітника стаж роботи і вони відіграють головну роль в статистиці.

Украинкский

2013-09-21

1.67 MB

36 чел.

PAGE  62

Міністерство фінансів України

Львівська державна фінансова академія

Кафедра економіки, менеджменту та державного управління

РОБОЧИЙ ЗОШИТ

З НАВЧАЛЬНОЇ ДИСЦИПЛІНИ «СТАТИСТИКА»

для лекційних занять

для студентів, які навчаються за галуззю знань

0305 «Економіка та підприємництво»

за напрямом підготовки 6.030508 «Фінанси і кредит»

освітньо-кваліфікаційного рівня «бакалавр»

ЛЬВІВ – 2011


Статистика // Робочий зошит для лекційних занять. – Львів, ЛДФА: Видавництво ВТЗНВ, 2011. – 108 с.

Розробник:

Капленко Г.В., кандидат економічних наук, доцент, доцент кафедри економіки, менеджменту та державного управління Львівської державної фінансової академії

У робочому зошиті коротко викладені основні теми навчальної дисципліни.

Розглянуто і схвалено на засіданні кафедри економіки, менеджменту та державного управління (Протокол №1 від 31 серпня 2011 р.) як робочий зошит для лекційних занять з навчальної дисципліни «Статистика» підготовки бакалаврів галузі знань 0305 «Економіка та підприємництво».

ББК

ЛДФА, 2011


ГРАФІК РОЗПОДІЛУ НАВЧАЛЬНОГО ЧАСУ ЗА ТЕМАМИ НАВЧАЛЬНОЇ ДИСЦИПЛІНИ І ВИДАМИ НАВЧАЛЬНОЇ РОБОТИ ЗА ОПП

т

е

м

и

Назва розділів,  тем

Кількість годин за ОПП

Розподіл аудиторних годин

Всього

в  т.ч.

СРС/ІНДР

Аудиторні заняття

Лекції

Практичні

Заліковий модуль

1

Методологічні засади статистики

4

2

2

2

2

Статистичне  спостереження

7

3

4

2

2

3

Зведення і групування статистичних даних

10

2

8

4

4

4

Подання статистичних даних: таблиці, графіки, карти

7

3

4

2

2

5

Узагальнюючі статистичні показники

18

2

16

6

10

6

Аналіз рядів розподілу

13

3

10

4

6

7

Аналіз концентрації, диференціації та подібності розподілів

7

5

2

2

8

Статистичні методи вимірювання взаємозв’язків

17

3

14

6

8

9

Аналіз інтенсивності динаміки

13

3

10

4

6

10

Аналіз тенденцій розвитку

7

3

4

4

11

Індексний метод

17

3

14

6

8

12

Вибірковий метод

4

4

Модульний контроль

2

2

2

Індивідуальна науково-дослідна робота

18

-/18

РАЗОМ

144

36/18

90

36

52

2

Календарно-тематичний план лекційних занять

Тема та короткий зміст заняття

К-сть

год

Тема 1. Методологічні засади статистики. Особливості статистики як самостійної суспільної науки. Основні поняття та категорії в статистиці. Основні етапи статистичного дослідження.

2

Тема 2. Статистичне спостереження. Поняття про статистичне спостереження, план проведення спостереження, форми і види спостереження, помилки спостереження, види контролю.

2

Тема 3. Зведення і групування статистичних даних. Види зведення і групування. Методологія статистичних групувань.

2

Тема 3. Зведення і групування статистичних даних. Види рядів розподілу та правила їх побудови.

2

Тема 4. Подання статистичних даних: таблиці, графіки, карти. Статистичні таблиці, вимоги до побудови. Статистичні графіки.

2

Тема 5. Узагальнюючі статистичні показники.  Класифікація показників. Абсолютні і відносні величини   

2

Тема 5. Узагальнюючі статистичні показники. Середні величини, умови і порядок їх обчислення. Середня арифметична. Середня гармонічна.

2

Тема 5. Узагальнюючі статистичні показники. Розподільчі середні – мода і медіана.

2

Тема 6. Аналіз рядів розподілу. Показники варіації та їх значення в статистичному аналізі. Характеристики варіації.

2

Тема 6. Аналіз рядів розподілу. Характеристики форми розподілу.

2

Тема 8. Статистичні методи вимірювання взаємозв’язків.  Класифікація ознак. Поняття про функціональну та стохастичну залежність між явищами. Метод аналітичного групування.

2

Тема 8. Статистичні методи вимірювання взаємозв’язків. Дисперсійний аналіз. Правило розкладання варіації та економічна суть кореляційного відношення.

2

Тема 8. Статистичні методи вимірювання взаємозв’язків. Кореляційний аналіз. Оцінка лінії регресії.

2

Тема 9. Аналіз інтенсивності динаміки. Поняття про ряди динаміки, їх види. Статистичні характеристики рядів динаміки.

2

Тема 9. Аналіз інтенсивності динаміки. Методи обчислення середніх величин у рядах динаміки.

2

Тема 11. Індексний метод. Поняття про індекси і їх значення в статистиці, види індексів. Агрегатні індекси.

2

Тема 11. Індексний метод. Системи взаємозалежних індексів. Розкладання загального абсолютного приросту за факторами.

2

Тема 11. Індексний метод. Середньозважені індекси. Індекси з постійними і змінними вагами

2

Разом

36


Тема 1.  МЕТОДОЛОГІЧНІ ЗАСАДИ  СТАТИСТИКИ.

План лекції

1. Загальне уявлення про статистику і відомості з її  історії.

2. Предмет статистики.

3. Основні категорії статистики.

4. Загальні поняття про статистичну методологію.

1. Загальне уявлення про статистику і відомості з її історії

Загальна теорія статистики є методологічною основою всіх галузевих статистик, оскільки вона розробляє найбільш загальні поняття і методи вивчення явищ і процесів у нерозривному зв’язку з їхньою якісною стороною, а також досліджує кількісне відображення закономірностей суспільного розвитку в конкретних умовах місця і часу.

Вперше термін «статистика» ми знаходимо у художній літературі – в «Гамлеті» Шекспіра (1602 р., акт 5, сцена 2). Сенс цього слова у Шекспіра – знать, прислуга. Мабуть, воно походить від латинського слова status, що в оригіналі означає «стан» або «політичний стан».

Спочатку під статистикою розуміли опис економічного і політичного стану держави або його частини. Наприклад, до 1792р. відноситься визначення: «статистика описує стан держави в даний час або в деякий відомий момент у минулому». І в даний час діяльність державних статистичних служб цілком укладається в це визначення.

У ХХ ст. статистику часто розглядають перш за все як самостійну наукову дисципліну. Статистикою є сукупність методів і принципів, згідно яким проводиться збір, аналіз, порівняння, уявлення і інтерпретація числових даних (1925р.). У 1954 р. академік АН УРСР Б.В.Гніденко дав наступне визначення: «Статистика складається з трьох розділів:

1) збір статистичних відомостей, тобто відомостей, що характеризують окремі одиниці яких-небудь масових сукупностей;

2) статистичне дослідження отриманих даних, що полягає у з'ясуванні тих закономірностей, які можуть бути встановлені на основі даних масового спостереження;

3) розробка прийомів статистичного спостереження і аналізу статистичних даних. Останній розділ, власне, і складає зміст математичної статистики».

Термін «статистика» використовують ще в двох сенсах. По-перше, в обігу під «статистикою» часто розуміють набір кількісних даних про яке-небудь явище або процес. По-друге, статистикою називають функцію від результатів спостережень, використовувану для оцінювання характеристик і параметрів розподілів і перевірки гіпотез.

Слово «статистика» в його сучасному значенні вперше вжив німецький учений Готфрід Ахенваль (1719-1772), запозичивши його з італійської мови. У Італії епохи Відродження набули поширення знання про політику, що склали спеціальну дисципліну, яка називалася ragione di stato або diciplina de statu. Слова stato і statu відповідали поняттю «держава» (звідси німецьке Staat і англійське state). Людину, майстерну в політиці, знавця різних держав називали statista. У Германії XVII в. було поширено словосполучення diciplina stattіstica – статистичну дисципліну. Ахенваль, перетворивши прикметник на іменник, ввів слово Statistica, що означало суму знань, потрібних купцям, політикам, військовим і всім культурним людям. Але шлях формування статистики був і довгий, і складний. Він почався із зародження господарського обліку.

У XVII в. у Західній Європі склалися певні умови, які призвели до виникнення статистики. Це ще була не наука в сучасному розумінні, а раціоналістичний погляд на природу держави, теорія не відділялася від практики, вона була нерозривна з нею. В цілому це був величезний крок вперед. Формування статистики стало можливе завдяки:

  •  широкому розвитку первинного обліку, накопиченню масових, описових даних в області суспільних явищ, які можна було використовувати для статистичних узагальнень;
  •  наявності шарів суспільства, які могли формувати науку, зокрема соціальну;
  •  підвищенню потреби в кількісному вимірюванні явищ і закономірностей суспільного життя, викликаних потребами практичної діяльності, - політичною, економічною, адміністративною і ін., а також наук, що вивчають суспільство;
  •  розвитку фундаментальних наук (в першу чергу філософії, математики, права), які дозволили усвідомити необхідність статистики як знаряддя соціального пізнання, розкрити її специфіку, визначити основні методологічні принципи;
  •  зміні людської свідомості, бачення світу, формуванню нових уявлень про державу і суспільство.

У цих умовах формування статистики стало неминучим. Проте науки народжуються не в одній колисці. Статистика не становила винятку. Вона виникла в XVII в. майже одночасно в Європі і Англії. Але форми виникнення і її зміст були різні: державознавство – в Європі і політична арифметика – в Англії, що стали потім двома напрямами в статистичній науці.

Роботи в області політичної арифметики присвячені соціально-економічним питанням. Вони виявляли закономірності суспільного, перш за все економічного життя. Вимірювальні методи вважалися обов'язковою умовою дослідження масових облікових даних. Сам термін «політична арифметика» свідчив про додаток математики до політики, про вимірювання фактів соціально-економічного життя (слово «політика» було аналогічно поняттю «Наука про суспільство»).

Істотно іншим був підхід державознавства. Хоча основою цього напряму були праці Ф.Саісовіно і його послідовників, справжньою батьківщиною державознавства була Німеччина – країна з міцними традиціями так званого камерального (бюджетного) обліку. Статистика – державознавство – базувалася на визнанні держави єдиним джерелом спостереження, єдиним апаратом спостереження – чиновників, адміністраторів, керівників, поліцейських. Представники цього напряму недооцінювали математичні засоби пізнання. Вимірювальний характер статистики, принаймні на перших порах, не розглядався як її відмінна особливість. Кількісні оцінки трактувалися як окремий випадок загального опису. Звідси і інша назва цього напряму – описова статистика.

Політична арифметика і державознавство – це напрями, які не протистоять один одному. Вони пов’язані з поступовим розвитком господарського обліку. З державознавства виділилися статистика, економічна і політична географія, з політичної арифметики – політична економія, статистика, демографія. У того і іншого напряму практично загальний предмет – суспільство (у державознавців – держава), але різні методи: опис і вимірювання.

Одна з найважливіших заслуг політичних арифметиків – розуміння необхідності масових даних як умови отримання стійких, доказових висновків. Політичні арифметики в цілому правильно визначили суть статистики, її завдання і значення як методу соціального пізнання. Але із-за бідності початкових облікових даних, неопрацьованості прийомів і методів статистики, відсутності традицій, що склалися, в дослідженнях інтересу до теоретичних питань статистичного методу у політичних арифметиків не було, вони не усвідомили необхідність теорії статистики. Успіхам політичних арифметик сприяв їх нерозривний зв'язок з практичною політичною і економічною діяльністю. Про це свідчать соціальне положення і заняття видних представників політичної арифметики: Граунт – крупний торговець, член міської ради Лондона; Давенант – генеральний інспектор Англії з експорту і імпорту; Кинг – секретар комісарів, що одержували і зводили публічні звіти; Вобан – відомий військовий і політичний діяч; Петті – людина дивовижної біографії, що змінила десятки занять, знаходилася в самій гущавині сучасного йому політичного життя, користувався довірою і Кромвеля (1599-1658) і короля Карла II (1662-1685), а потім Якова II (1685-1688). Всі роботи політичних арифметиків присвячені актуальним проблемам свого часу. Для них статистика – засіб політико-економічних досліджень.

Згодом розвиток статистичного методу показав його значущість для різних сфер, не тільки соціально-економічної. Але на перших етапах існування статистики єдність з політичною економією була необхідна: це давало можливість встановити об’єктивні передумови статистичного вимірювання і тим самим забезпечувало правильність відображення статистикою соціально-економічного життя.

Цей зв’язок з політичною економією і правом добре простежується і в державознавстві.

Державознавство часто називалося описовою школою статистики. Її представники вважали, що статистика є наукою, завдання якої – систематизований опис визначних державних «пам'яток». У число визначних пам'яток включали все, що впливає на добробут держави. Таким чином, статистика розглядалася як суспільна наука про соціальні, правові і господарські аспекти держави. Якщо для політичних арифметиків застосування мови чисел, мір і ваг було обов'язковим, то державознавці, особливо спочатку, обходилися без кількісних даних, до того ж часто можливість отримати їх була відсутня із-за слабкого розвитку первинного обліку. Даних не вистачало і політичним арифметикам, але їх недолік вони прагнули заповнити різноманітними непрямими розрахунками, тоді як державознавці задовольнялися словесними описами і довіряли тільки прямій і повній інформації. Непрямі розрахунки вони вважали фантазією. Якщо говорити про відмінність описової школи від школи політичної арифметики мовою сучасної науки, то першу характеризує комплексний підхід, другу – системний.

Одним з основоположників описової школи був Герман Конрінг (1606-1681) – видатний лікар і видний державний діяч свого часу. Він першим почав читати лекції з державознавства в університеті (з 1660) в Гельмштедте. Мету нової науки Конрінг сформулював так: навчити політичних діячів розуміти причини державно важливих явищ, які він підрозділяв на чотири групи: матеріальні – опис території і населення, формальні – політичний устрій, кінцеві (цільові) – добробут держави і його громадян, адміністративні, – управління державою, його апарат (чиновники, армія і т. д.). Ці чотири частини зумовили розвиток демографії, політичної географії, бюджетної статистики і адміністративної статистики.

Ідеї Конрінга здобули широку популярність, головним чином завдяки енергійній діяльності його послідовника Готфріда Ахенваля (1719-1772). Саме йому призначено було створити школу, що зробила величезний вплив на долі статистики і неподільно панувала в Європі до середини XIX в.

Розробка теорії динаміки циклічної ринкової економіки стала головним напрямком статистичних досліджень Харківської економічної школи за 200 років. У 1866р. вперше у світі в дипломній роботі випускника університету І. Г. Кауфмана «Теорія коливання цін» сформульована ідея про наявність економічних циклів у розвитку економіки.

Дослідження у статистиці допомогло іншому вихованцю Харківського університету М.І.Туган-Барановському (1865 – 1919) створити теорію економічної кон’юнктури. В сучасних умовах ринкової економіки статистика економічної і соціальної кон’юнктури відіграє значну роль у підвищенні економічної ефективності інституційних одиниць і якості життя населення. М.І. Туган-Барановський був одним із фундаторів Української академії наук, міністром фінансів в уряді голови Центральної Ради України М.С.Грушевського.

У 1962- 1964 роках проф.. Харківського університету О.Г. Ліберман (1897 – 1982) пропонував розгорнути в СРСР ринкову економічну реформу. Ця реформа у формі «Нової системи господарювання» («Хрущовська відлига») послужила прологом до «перебудови» М.С.Горбачова й до сучасних економічних реформ в Україні, Росії та інших країн Східної і Центральної Європи. Студент Харківського університету С.А.Кузнєц (1901 – 1985) став єдиним українським лауреатом Нобелівської премії з економіки за статистичні дослідження економічного зростання держав в залежності від обсягу і структури інвестицій.

На початку 21 ст. великого розвитку набули статистичні системи. Система національних рахунків (СНР) охоплює усі сектори, галузі та сфери економічного та соціального життя держави. Принципово нові можливості використання статистичної інформації створює планетарна система Іnternet.

У сучасному розумінні термін «статистика» має декілька значень:

  •  в широкому розумінні під статистикою розуміють практичну діяльність статистичних установ, які збирають і обробляють інформацію про різні явища і процеси суспільного життя;
  •  під статистикою розуміють також сукупність цифрових показників, що характеризують певні статистичні сукупності чи суспільство в цілому. Наприклад, відомості про демографічну ситуацію, інформація про результати діяльності окремих галузей матеріального і нематеріального виробництва;
  •  під статистикою розуміють окрему галузь науки, яка має свій предмет і метод дослідження.

2.  Предмет статистики

Статистика як наука має свій предмет дослідження. Об’єктом вивчення статистики є людське суспільство, явища i процеси суспільного життя.

Специфічна риса предмета – це призначення статистики говорити за допомогою цифр. Вивчаючи кiлькiсну сторону явищ,  статистика відображає її в своїх числах – показниках, i саме цим характеризує конкретну міру явищ, встановлює загальні властивості, виявляє схожість i вiдмiннiсть окремих рис, виявляє певні типи явищ.

Статистику як суспільну науку характеризують такi важливi риси:

  •  статистика вивчає суспільні явища. Явища, що знаходяться поза сферою суспільної діяльності людини, не піддаються статистичному обліку і вивченню;
  •  кiлькiсна сторона суспільних явищ вивчається статистикою у нерозривному зв’язку з їх якісною стороною;
  •  кiлькiсну сторону суспільних явищ статистика вивчає в конкретних умовах місця i часу;
  •  статистика вивчає масовi суспiльнi явища. Статистика досліджує явища, якi повторюються в просторi або впродовж часу. Для масового явища характерна  участь в ньому певної множини елементiв, iстотнi властивостi яких схожі;
  •  статистика також вивчає вплив природних i технiчних  факторiв на кiлькiснi змiни суспiльного життя i вплив розвитку суспiльства на природнi  умови  життя  суспiльства.

Отже, предметом статистики як суспiльної науки є кiлькiсна сторона масових суспiльних явищ i процесiв у нерозривному зв’язку з їх якiсною стороною, кiлькiсне вiдображення закономiрностей суспiльного розвитку в конкретних умовах мiсця й часу.

Давньогрецьке слово «статистика» означає «ціле, що складається з окремих частин». У такому значенні вживав цей термін давньогрецький вчений Аристотель. У наш час система – це єдина сукупність, що складається з елементів, взаємозв’язків і взаємозалежностей між ними, а також навколишнього їхнього середовища.

Статистика є багатогалузевою наукою і господарською практикою. Вона складається з окремих галузей, які, виступаючи її самостійними частинами, тісно пов’язані між собою в єдине, нерозривне ціле – в систему галузей статистики.

На сьогодні немає загальноприйнятої класифікації галузей і відповідно дисциплін статистики. Однак, аналізуючи всесвітній досвід практичного застосування статистики, можна рекомендувати таку класифікацію:

1. Загальна теорія статистики (розглядає загальні основи теорії і практики статистики, включаючи використання її найважливіших методів).

2. Адміністративна статистика (статистика управління державами, регіонами, містами, господарськими (інституційними) одиницями (підприємствами, організаціями, установами).

3. Економічна статистика. Досліджує за допомогою статистичних показників масові явища і процеси, які відбуваються в економіці. Охоплює галузеві статистики економіки (статистику промисловості, будівництва, сільського господарства, транспорту, зв’язку, торгівлі та інше), а також статистики найважливіших сфер діяльності і показників економіки (фінансову статистику, біржову статистику, статистику цін тощо).

4. Соціальна статистика (статистика соціальної сфери діяльності: статистика туризму, охорони здоров'я, освіти, культури, правова статистика і ін.).

5. Статистика науки (як галузі господарства).

6. Статистика природних ресурсів і навколишнього середовища.

7. Міжнародна статистика.

8. Математична статистика.

9. Статистики природознавчих наук. Досліджують за допомогою статистичних показників масові явища і процеси, які відбуваються в природі (статистична фізика і ін.).

10. Інші галузі і дисципліни статистики.

3. Основні категорії  статистики

У складi категорiй статистичної науки важливе мiсце належить таким поняттям як статистична сукупнiсть, статистична закономiрнiсть i закон великих чисел.

Пiд статистичною сукупнiстю розумiють масу однорiдних у певному вiдношеннi елементiв (фактiв, явищ тощо), якi мають єдину якiсну основу, але рiзняться мiж собою певними ознаками.

Ознака – це статистичний еквівалент властивостей, притаманних елементам сукупності. Кожний елемент сукупності характеризується багатьма ознаками, значення яких змінюється від елемента до елемента або від одного періоду до іншого. Ознака, яка набуває в межах сукупності різних значень, називається варіюючою (змінною, мінливою), а відмінність, коливання ознаки – варіацією. Наприклад, ознаки людини: вік, стать, сімейний стан, освіта тощо; ознаки підприємства: спеціалізація, форма власності, рентабельність виробництва і т.ін.

За характером вираження ознаки поділяють: Атрибутивні – ознаки, окремі значення яких виражаються словами. Серед атрибутивних ознак одні чітко окреслені (стать, професія, освіта), інші невизначені (суб’єктивні оцінки, твердження, думки). Кількісні – ознаки, окремі значення яких виражаються числами (вік людини, розряд робітника, стаж роботи) і вони відіграють головну роль в статистиці.

За способом вимірювання розрізняють: Первинні ознаки характеризують одиницю сукупності в цілому. Це абсолютні величини. Їх можна вимірювати, рахувати, зважувати і вони існують незалежно від їх статистичного вивчення. Наприклад, площа орних земель, потужність двигунів, чисельність населення міста. Вторинні (розрахункові) ознаки не вимірюються безпосередньо, а розраховуються.

По відношенню до об’єкта, який характеризують ознаки поділяють: Прямі – це властивості, які безпосередньо властиві тому об’єкту, який ними характеризується. Так, вік людини, обсяг продукції на підприємстві, чисельність робітників тощо. Непрямі є властивостями, які властиві не самому об’єкту, а іншим сукупностям, які пов’язані з об’єктом, входять до нього.

За характером варіації, тобто залежно від їх значень у різних одиниць сукупності, ознаки поділяються на: дискретні – кількісні ознаки виражені окремими цілими числовими значеннями (розряд робітника, кількість членів сім’ї, кількість поверхів у будинку). Неперервні, тобто ознаки які варіюють неперервно, можуть мати будь-які значення в певних межах варіації (вік людини, зарплата, ціна одиниці товару тощо).

Виділяють також альтернативні ознаки, які можуть мати тільки два значення. Такими є ознаки володіння або не володіння чимось. Наприклад, альтернативними є стать, місце проживання тощо.

За часовою ознакою ознаки поділяють: Моментні ознаки характеризують досліджуваний об’єкт на певний момент часу, встановлений планом статистичного спостереження. Інтервальні, до яких відносяться ознаки, які характеризують результати процесів. Тому ці значення можуть виникати тільки за інтервал часу: рік, місяць, добу.

Якісна однорідність одиниць сукупності – це схожість одиниць сукупності (об’єктів, явищ) за якимись суттєвими ознаками, хоча за іншими ознаками вони можуть різнитися. Наприклад, промислові підприємства певної сукупності (однієї галузі), поряд з якісною однорідністю (приналежністю до цієї галузі), мають відмінності щодо розміру основних фондів, обсягу виробництва, чисельності працівників тощо. Однорідність сукупності встановлюють у кожному конкретному статистичному дослідженні відповідно до його мети і пізнавальних завдань.

Статистична закономiрнiсть виражає середній результат взаємодії значного числа однорідних явищ, тобто статистична закономiрнiсть не виражає властивості кожного явища окремо, а тільки в масових процесах, або в загальній системi.

Відображаючи характер дії об’єктивних законів розвитку суспільства в конкретних умовах простору і часу, статистичні закономірності проявляються по-різному. Їх можна об’єднати в такі групи:

  1.  Закономірності розвитку (динаміки) явищ. Так, статистика свідчить про збільшення кількості населення Земної кулі, зростання тривалості життя людини тощо.
  2.  Закономірності розподілу елементів сукупності. Це може бути розподіл населення за віком, сімей – за кількістю дітей, середньодушовим доходом.
  3.  Закономірності структурних зрушень. Прикладом може бути збільшення частки міського населення в загальній його чисельності.
  4.  Закономірності зв’язку між явищами. Наприклад, залежність продуктивності праці від фондоозброєності, собівартості продукції – від продуктивності праці, урожайності – від родючості ґрунтів, попиту – від ціни на товар.

Закон великих чисел базується на загальному принципi, згiдно з яким властивостi об’єктивного свiту яскраво проявляються у великiй масi випадкiв. Змiст закону великих чисел  зводиться до характеристики тенденцiї збiльшення числа спостережень для одержання результату, що не залежить вiд випадку. Сам закон великих чисел не є регулятором масових процесів і явищ, а лише необхідною передумовою їх прояву.

Статистичний показник – це кiлькiсна оцінка властивостей явища, що вивчається. Статистична iнформацiя створюється, передається i зберігається у вигляді показників.

Щодо статистичної природи показники надзвичайно різноманітні. Вони поділяються за такими ознаками, як спосіб обчислення показника, часова визначеність, адитивність.

За способом обчислення розрiзняють первиннi i похiднi (вториннi) показники.

За ознакою часу показники подiляють на iнтервальнi i моментнi. Iнтервальнi характеризують явище за певний час (день, декаду, мiсяць, рiк). До моментних вiдносяться показники, що дають кiлькiсну характеристику явищ на певний момент часу. Інтервальні і моментні показники можуть бути як первинними, так і похідними.

Характерною особливістю первинних показників є адитивність, тобто можливість підсумовування. Похідні показники в більшості своїй неадитивні.

4. Загальні поняття про статистичну методологію

Термін «метод» походить від давньогрецького слова «методос» – «шлях дослідження». У наш час термін «метод» означає сукупність засобів і способів дослідження.

Аналізуючи всесвітній досвід практичного застосування статистичних методів, можна рекомендувати таку класифікацію:

1. Методи збирання статистичної інформації (методи опитування, анкетування, звітних спостережень, самореєстрації, статистичних вибірок тощо).

2. Методи групування, сегментації, класифікацій і таблиць.

3. Методи середніх величин (методи побудови і використання середніх величин).

4. Графічні методи.

5. Балансові методи (включаючи баланси Системи національних рахунків, бюджети і баланси країн, регіонів, міст тощо).

6. Індексні методи і методи побудови рейтингів.

7. Матричні методи.

8. Методи кореляційно-регресійного аналізу (включаючи найновіші методи робастних процедур та оцінок).

9. Дисперсійний, факторний і компонентний аналіз.

10. Методи експертних оцінок.

11. Методи дослідження рядів динаміки.

12. Методи виробничих функцій. 

13. Методи системного аналізу (метод дерева цілей, „дерева” статистичних показників та інші методи побудови та застосування систем).

14. Методи фундаментального і технічного аналізу фінансової статистики.

15. Методи програмування (лінійного, нелінійного, оптимального, динамічного, дискретного, блочного тощо).

16. Методи пробних впроваджень (пробних статистичних переписів, цензів, кон’юнктурних обстежень, нових інформаційно-аналітичних систем тощо).

17. Методи контролю статистичної інформації (логічний і арифметичний контроль, повторні обстеження тощо).

18. Методи передачі і розповсюдження статистичної інформації (у спеціальних статистичних публікаціях, періодиці, Інтернет і т. ін.).

19. Методи зберігання і захисту статистичної інформації (включаючи конфіденційну інформацію).


Тема 2.  СТАТИСТИЧНЕ СПОСТЕРЕЖЕННЯ.

План лекції

  1.  Поняття про статистичне спостереження.
  2.  Програмно-методологічні питання статистичного спостереження.
  3.  Організаційні питання статистичного спостереження.
  4.  Форми статистичного спостереження.
  5.  Види та способи спостереження.
  6.  Помилки спостереження та способи їх виправлення.

1. Поняття про статистичне спостереження

Початковою стадією статистичного дослідження є збір статистичної iнформацiї про соцiально-економiчнi процеси, тобто статистичне спостереження.

Статистичне спостереження – це планомірний, науково організований процес збирання даних щодо масових явищ і процесів, які відбуваються в економічній, соціальній та інших сферах життя, шляхом їх реєстрації за спеціальною програмою, розробленою на основі статистичної методології.

Від якості даних спостереження залежать результати подальшого статистичного дослідження. Тому вони мають відповідати певним вимогам.

Перша вимога – це вірогідність даних, тобто їх відповідність реальному стану.

Друга вимога – це повнота даних як за їх обсягом, так і по суті.

Третя вимогасвоєчасність даних.

Четверта вимога порівнянність даних у часі або у просторі. Дані повинні бути порівнянними: за складом сукупності; за одиницями вимірювання; за методикою збирання даних та обчислення статистичних показників; за територіальною належністю одиниць.

П’ятою вимогою є доступність даних. Одержання якісних статистичних даних значною мірою залежить від того, на якому рівні збирається відповідна інформація. В Україні діють дві системи: централізована (загальнодержавна) та децентралізована (відомча, окремих економічних структур).

Статистичне спостереження здійснюється в три етапи:

1) Підготовка спостереження. На першому етапі складається докладний план статистичного спостереження.

2) Реєстрація статистичних даних.

3) Формування бази даних.

Статистичне спостереження проводиться у відповідності з планом статистичного спостереження, що містить програмно-методологічні та організаційні питання. План статистичного спостереження включає широке коло питань методики та органiзацiї збору статистичної iнформацiї, контролю її якості i вiрогiдностi.

2. Програмно-методологiчнi питання статистичного спостереження

Програмно-методологiчна частина плану – це визначення мети, встановлення об’єкту та одиниць спостереження, складання програми спостереження.

Мета спостереження – отримання статистичних даних, які є підставою для узагальненої характеристики стану та розвитку явища або процесу з визначенням відповідної закономірності. Вона формулюється ясно, чітко, конкретно з урахуванням завдань статистичного спостереження.

Вiдповiдно до мети визначають об’єкт i одиниці спостереження. Об'єкт спостереження – це сукупність явищ, що вивчаються в процесі спостереження. Об’єкт спостереження як сукупність складається з окремих одиниць.

Одиниця сукупності – це первинний елемент об’єкта, що є носієм ознак, які підлягають реєстрації (може бути підприємство, людина, факт, предмет, процес тощо).

Одиниця статистичного спостереження – це складовий елемент об’єкту спостереження, який є носієм ознак, що підлягають реєстрації в процесі спостереження.

Звітна одиниця – це джерело інформації, тобто елемент сукупності, від якого мають одержати відомості про одиницю спостереження.

Програма спостереження – це перелік питань, на які потрібно дістати відповіді в процесі спостереження відносно кожної одиниці спостереження.

Для реалізації програми статистичного спостереження розробляється статистичний інструментарій це набір статистичних формулярів, а також інструкцій і роз’яснень щодо проведення статистичного спостереження, реєстрації даних.

Статистичний формуляр – це обліковий документ єдиного зразка, що містить адресну характеристику об’єкта спостереження та статистичні дані про нього.

3. Органiзацiйнi питання статистичного спостереження

Організаційна частина плану статистичного спостереження передбачає перелік заходів, які забезпечують успішне виконання роботи із збирання і обробки матеріалів. Організаційний план статистичного спостереження визначає місце, час i органи спостереження, календар спостереження, графік підготовки та інструктажу кадрів, джерела і способи одержання даних, матерiально-технiчну  базу спостереження, систему контролю результатів спостереження.

Місцем спостереження вважають пункт, де безпосередньо реєструються ознаки окремих одиниць сукупності. Здебільшого воно збігається з місцем знаходження одиниць спостереження.

Для забезпечення вірогідності та своєчасності інформації слід вирішити питання часу та періоду спостереження.

Час спостереження – це той час, до якого відносяться дані, які збираються. Час реєстрації даних для всіх одиниць встановлюється один – щоб уникнути неповноти обліку або повторного рахунку, а також для забезпечення порівнянності даних.

Об’єктивний час  це критичний момент або момент часу, станом на який реєструються дані. Статистичні дані характеризують досліджуване явище або за певний період часу, або на певний момент часу. Якщо об’єктом спостереження є процес, то обирається інтервал часу, за який нагромаджуються дані. Якщо об’єктом спостереження є певний стан, то обирається момент часу, станом на який здійснюється реєстрація даних. Наприклад, виробництво продукції враховується за певний період часу (декада, місяць, квартал, пiврiччя, рiк), а наявність житлового фонду чи дитячих дошкільних закладів – на певну дату.  

При вивченні об’єктів спостереження, чисельність і характеристика яких безперервно змінюються, встановлюється критична дата, станом на яку збираються відомості. При вивченні такого рухомого об’єкта, як населення, недостатньо визначати час спостереження – адже склад населення і його характеристики постійно змінюються (народжуються і вмирають), тому дані реєструються станом на визначений момент часу, який називають критичним моментом спостереження. Так, критичним моментом перепису населення 2001 року була 12 година ночi з 4 на 5 грудня. Відповідно у бланки перепису заносились всі живі на даний момент і не вносились, які народились після цієї години.

В плані вказується термін проведення спостереження, тобто час початку і закінчення збирання даних. Суб’єктивний час – період, протягом якого реєструються ознаки об’єкта спостереження. При переписі населення вiн  становив 10 днiв. Якщо строк подання мiсячного звiту 5 лютого, то суб’єктивний час, тобто час складання звiту, буде з 1 до 5 лютого, а об’єктивний – один мiсяць (сiчень). Суб’єктивний час повинен бути по можливостi коротшим i максимально наближеним критичного моменту.

4. Форми статистичного спостереження

З точки зору організації статистичного спостереження розрізняють три основні організаційні форми спостереження:

  1.  звітність;
  2.  спецiально органiзоване статистичне спостереження;
  3.  реєстри.
  4.  Звітність – це форма спостереження, при якій кожний суб’єкт діяльності регулярно подає дані в державні органи статистики та відомства у вигляді документів (звітів) спеціально затвердженої форми.

Статистична звітність – це встановлені законодавством стандартні форми документів з уніфікованими комплексами статистичних показників, котрі системно характеризують різні сторони діяльності і  параметри облікових одиниць. У статистиці обліковими одиницями є підприємства, організації і установи, а також галузі діяльності, сектори економіки, села, окремі території, регіони (області і т. ін.), країни. За різними ознаками статистичну звiтнiсть подiляють на окремi види.

Типова звітність має єдину форму i зміст для всіх підприємств i організацій незалежно від форми власності та відомчого підпорядкування.

Спеціалізована звітність властива тим підприємствам чи окремим виробництвам, що мають свої специфічні властивості.

Залежно від рівня затвердження та призначення звітність поділяється на зовнішню і внутрішню.

Зовнішня затверджується та збирається органами державної статистики, міністерствами та відомствами, внутрішня – розробляється самим суб’єктом діяльності для власних оперативних, управлінських та аналітичних потреб.

За перiодичнiстю подання звiтнiсть буває поточна (тижнева, декадна, мiсячна, квартальна), яка охоплює показники поточної діяльності суб’єктів, i річна, що підбиває головні підсумки фінансово-виробничої діяльності суб’єктів за рік.

Залежно від терміновості звіти можуть подаватись такими способами: поштою, телетайпом, електронною поштою.

За порядком проходження звiтнiсть подiляють на централiзовану i децентралiзовану. Централізована звітність проходить через систему державної статистики, де обробляється i передається відповідним органам управління. Децентралізована звітність опрацьовується у відповідних міністерствах чи відомствах, а зведену інформацію подають статистичним органам.

Звітність характеризується такими властивостями, як обов’язковість, систематичність, вірогідність.

  1.  Спеціально організовані статистичні спостереження охоплюють ті сторони суспільного життя, які не враховуються звітністю. До них належать переписи, обліки, спеціальні обстеження, опитування.

Перепис – суцільне або вибіркове спостереження з метою вивчення їхнього розміру та складу на певну дату або певний момент часу. 

Обліки – суцільні спостереження, які ґрунтуються на даних огляду, опитування та документальних записів.

Спеціальні обстеження – несуцільні спостереження окремих масових явищ згідно з певною тематикою, що виходить за межі звітності. Вони можуть бути періодичними або одноразовими.

Опитування – це, як правило, несуцільне спостереження думок, мотивів, оцінок, що реєструються зі слів респондентів. Винятком є суцільне опитування всього населення – референдум – масове волевиявлення щодо принципових соціально-економічних та політичних питань. Опитування можуть здійснюватись у різних формах: усній (інтерв’ю), письмовій (анкетування), заочній (поштові, телефонні).

  1.  Статистичний реєстр – це список або перелік одиниць певного об’єкта спостереження із зазначенням необхідних ознак, який складається та оновлюється під час постійного відстежування.

5. Види та способи спостереження

За часом реєстрації даних статистичне спостереження подiляють на поточне, періодичне  i одноразове.

Поточне спостереження полягає у систематичній реєстрації фактів по мірі їх виникнення або збирання фактів щодо безперервного процесу.

Періодичне спостереження проводиться регулярно, здебільшого через певні (як правило, рівні) проміжки часу.

Одноразове спостереження проводять епізодично по мірі виникнення потреби в дослідженні явища чи процесу з метою вирішення певних соціально-економічних завдань.

За способом одержання статистичних даних спостереження поділяють на  безпосереднє, документальне i опитування.

Безпосередній облік – це реєстрація фактів, яка передбачає безпосередній огляд, перелік, вимірювання, зважування та ін.

Документальний облік – це реєстрація фактів, яка ґрунтується на даних різноманітних документів первинного обліку.

Опитування респондентів – це такий вид спостереження, при якому реєстрація фактів здійснюється на основі даних, що одержують від осіб, що опитуються. Опитування буває таких видів: експедиційне, самореєстрацiя, кореспондентське i анкетне.

За повнотою охоплення одиниць сукупності спостереження подiляють на суцiльне i несуцiльне.

Суцільне спостереження – це обстеження, під час яких реєструються всі одиниці обстежуваної сукупності.

Несуцільне спостереження – це обстеження, під час яких реєструються не всі одиниці сукупності, а тільки певна їх частина.

Несуцiльнi спостереження поділяють на такі види: спостереження основного масиву, вибіркове, монографічне, анкетне, моніторинг.

6.  Помилки  спостереження та способи їх виправлення

Помилки спостереження  це розбіжності між даними спостереження i дійсним значенням показників, що вивчаються.

Залежно від причин виникнення розрізняють помилки репрезентативності та помилки реєстрації.

Помилки репрезентативності мають місце тільки при вибірковому спостереженні. Вони виникають через несу цільність реєстрації даних і порушення принципів випадковості відбору.

Помилки реєстрації  це помилки, які виникли внаслідок неправильного встановлення фактів, або неправильного їх запису, або того і іншого разом. Вони допускаються як при суцільному, так i несуцiльному спостереженні.

Залежно від природи виникнення помилки реєстрації можуть бути випадковими або систематичними.

Випадкові помилки виникають внаслідок дії випадкових непередбачуваних причин i спричиняють відхилення даних у сторону збільшення чи зменшення. Такі помилки частіше бувають ненавмисними. 

Систематичні помилки є невипадковими і мають визначену спрямованість.

Систематичні помилки можуть бути навмисними i ненавмисними.

Систематичні навмисні помилки реєстрації виникають внаслідок свідомого, навмисного викривлення фактів із певною метою. Це, наприклад, масові факти приховування у звітах доходів від оподаткування, приписки у звітах.

Ненавмисні помилки виникають внаслідок необґрунтованості програми спостереження, некомпетентності реєстраторів, неосвіченості респондентів.

З метою попередження, виявлення та виправлення помилок використовується такий захід, як контроль. Контроль означає, насамперед, перевірку даних обстежень щодо їх повноти й вірогідності. Дані на вірогідність перевіряють засобами логічного та арифметичного контролю.

Арифметичний контроль передбачає перевірку даних протягом усього процесу одержання i опрацювання інформації. Це перевірка підсумкових даних, перевірка правильності розрахунку середніх і відносних показників, балансового методу, погодження тих показників, які виводяться один з одного.

Логічний контроль застосовують у взаємодії з арифметичним контролем у процесі опрацювання статистичної інформації. Він полягає в зіставленні відповідей на питання і з’ясуванні їх логічної сумісності.


Тема 3. ЗВЕДЕННЯ  I  ГРУПУВАННЯ  СТАТИСТИЧНИХ  ДАНИХ. РЯДИ РОЗПОДІЛУ.

План лекції

  1.  Поняття про статистичне зведення. Види зведення.
  2.  Статистичні групування. Види групування.
  3.  Основні питання методології статистичних групувань.
  4.  Ряди розподілу.

1. Поняття про статистичне зведення. Види зведення.

Суть статистичного зведення полягає у класифікації та агрегатуванні матеріалів спостереження. Елементи сукупності об’єднують за певними ознаками в групи, класи, типи, а інформація про них агрегується як у межах груп, так і в цілому по сукупності.  Таким чином,

статистичне зведення – це процес упорядкування, систематизації i наукової обробки первинного статистичного матеріалу для виявлення характерних рис та певних типових ознак тих чи інших типів явищ, а також закономірностей процесів, що вивчаються.

Основне завдання зведення – підвести підсумок, узагальнити результати спостереження так, щоб стало можливим виявити характерні риси й істотні властивості тих чи інших типів явищ, виявити закономірності досліджуваних процесів.

За формою обробки даних зведення буває централізоване і децентралізоване.

Централізоване зведення – це зведення, при якому матеріали статистичного спостереження надсилають у центральний орган державної статистики, де їх обробляють за певною, заздалегідь встановленою програмою. Прикладом такого зведення є обробка матеріалів перепису населення.

Децентралізоване зведення передбачає обробку і підрахунок результатів спостереження на місцях, а Держкомстату України надсилають уже зведені підсумки за певними адміністративними одиницями. Так, при обробці статистичної звітності зведення здійснюється від нижчої до вищої ланки управління. Характерні класифікаційні позиції зведення такі: територіальна ознака (область, місто, район), підпорядкованість (міністерство, відомство), види економічної діяльності, форми власності.

2. Статистичні групування. Види групування.

Одним із основних і найбільш поширених методів обробки і аналізу первинної статистичної інформації є групування. 

Статистичне групуванняце розподіл на групи за будь-якою істотною ознакою усієї сукупності інформації про суспільні явища, зібраної в процесі спостереження.

Принцип групування: одиниці розподіляються по групах відповідно до такого принципу: різниці між одиницями, які відносяться до однієї групи, повинні бути менше, ніж між одиницями, які відносяться до різних груп.

Метод групування визначає межі і можливості застосування інших статистичних методів аналізу основних сторін і характерних особливостей досліджуваних явищ. За своєю роллю у процесі дослідження метод групування виконує деякі функції, аналогічні функціям експерименту у природничих науках: наслідки групування за окремими ознаками і комбінації самих ознак дають можливість виявити закономірності та взаємозв’язки явищ у певних умовах.

Відповідно до аналітичних функцій групувань розрізняють три види групувань: типологічні, структурні та аналітичні.

Типологічні групування – це розподіл сукупності на однорідні, типові за змістом групи. Наприклад, населення поділяють за працездатним віком на три основних групи: молодше працездатного віку (до 16 років), працездатний вік (жінки 16 – 54, чоловіки 16 – 59 років), старіше працездатного віку жінки 55 і старіше, чоловіки – 60 років і старіше).

У структурних групуваннях досліджується структура сукупності. Структура сукупності – це співвідношення її окремих змістових частин до цілого, яке приймається рівним одиниці чи 100%. Наприклад, структура академічної групи студентів за статтю становить: жінок – 60%, чоловіків – 40%, у цілому – 100%.

Таблиця 3.1. Схема структурного і типологічного групування

Межі групування за істотною ознакою

Кількість

одиниць сукупності

Система показників

Р а з о м

Аналітичні групування характеризують взаємозв’язок між явищами, впливу однієї ознаки на іншу. За допомогою аналітичних групувань виявляють наявність та напрямок зв’язку між двома ознаками, з яких одна представляє результат, інша – фактор, що впливає на результат.

Явища суспільного життя та їх ознаки тісно пов’язані між собою. Взаємопов’язані ознаки можна поділити на факторні і результативні. Ознака, яка впливає на інші та зумовлює їх зміни, називається факторною. Ознака, яка залежить від інших ознак і змінюється під їх впливом, називається результативною. Приклад аналітичного групування наведено у таблиці 3.2.

Таблиця 3.2. Залежність народжуваності дітей від віку матері

Вікові групи, років

Частка жінок, %

Середня кількість народжених на 1000 жінок

Молодші 20

16,1

57,4

20 – 24

14,1

165,1

25 – 29

15,9

91,4

30 – 34

16,6

44,0

35 – 39

15,6

16,1

40 – 44

13,3

3,7

45 – 49

8,4

0,2

Р а з о м

100,0

54,6

Залежно від кількості ознак, за якими проводиться групування виділяють два види групувань: просте і складне.

Просте групування – це групування одиниць сукупності за будь-якою однією групувальною ознакою.

Складне групування – це групування за двома і більше ознаками. Складне групування може бути комбінаційним, тобто групи, які виділені за однією ознакою, підрозділяються на підгрупи за іншою ознакою або багатомірним, якщо воно проводиться за певною множиною ознак одночасно. Наприклад, розподіл населення спочатку на групи за працездатним віком, а потім на підгрупи за статтю буде комбінаційним групуванням, а розподіл населення за рівнем споживання продовольчих або непродовольчих товарів одночасно – буде багатомірним групуванням.

Приклад комбінаційного групування.


Таблиця 3.3.
Розподіл житлового фонду Львівської області за формами власності та місцем знаходження

Показники

Загальна площа, млн. кв.м

Разом

у міських поселеннях

у сільській місцевості

Весь житловий фонд

28,1

21,9

50,0

у тому числі :

– державний та колективний житловий фонд

10,7

0,6

11,3

– приватний житловий фонд

17,4

21,3

38,7

Усі наведені вище приклади групування здійснені на основі безпосереднього узагальнення первинних даних статистичного спостереження. Такі групування можна назвати первинними.

Первинне групування здійснюється на основі безпосереднього узагальнення первинних даних статистичного спостереження. На практиці іноді доводиться перегруповувати раніше згрупований матеріал для забезпечення співставлення даних двох або декількох групувань, порівнянності структур двох сукупностей за однією і тією самою ознакою. Результат перегрупування називають вторинним групуванням. Перегрупування здійснюється або об’єднанням, або розбиттям інтервалів первинного групування.

3. Основні питання методології статистичних групувань.

Першочерговим питанням теорії групування є вибір ознак, за якими відмежовуються окремі групи. Ознаки, якi покладенi в основу групування, називаються групувальними ознаками. 

Розмаїття ознак, за якими може здійснюватись групування, можна певним чином класифікувати.

За формою вираження групувальні ознаки можуть бути атрибутивними і кількісними. 

Атрибутивними називаються ознаки, які не мають кiлькiсного вираження i реєструються у вигляді текстового запису. Окремим видом атрибутивних групувань є групування за  альтернативною ознакою, коли є лише два варiанти атрибутивної ознаки, причому один з них виключає інший. Наприклад, розподіл студентів на тих, хто одержує стипендію, i тих, хто її не одержує; підприємство може бути рентабельним, або збитковим.

Кiлькiснi (варіюючі) ознаки – це ознаки, які набувають різних цифрових характеристик і виражаються числовими значеннями. Наприклад, розподіл робiтникiв підприємства за віком, за стажем роботи, за розміром заробітної плати. Кiлькiснi ознаки, в свою чергу, поділяють на дискретні та iнтервальнi.

Дискретні (перервні) кiлькiснi ознаки виражаються в кожній групі тільки цілими числами. Наприклад, кваліфікаційний розряд робітників, кількість дітей у сім’ї, число кімнат у квартирі тощо. Ознаки, якi можуть набувати рiзного значення в певних межах, називаються iнтервальними або безперервними. Безперервна кількісна ознака в кожній групі визначається цілими одиницями та їх частками  в межах вiд одного числа до іншого. Різниця між максимальним i мінімальним значеннями ознаки в кожній групі називається величиною інтервалу (інтервалом групування).

При групуванні за кількісною ознакою постає питання щодо кількості груп i інтервалів групування. Питання про число груп і величину інтервалу слід вирішувати залежно від багатьох обставин, насамперед відповідно до мети дослідження і діапазону варіації групувальної ознаки. Число груп пов’язано з обсягом сукупності. Тут немає чітко визначених наукових прийомів, які дозволяють вирішувати це питання при любих обставинах. Кожного разу це завдання вирішується з урахуванням конкретних обставин. Однак, існує формула, запропонована американським вченим Стерджесом, за допомогою якої можна намітити число груп п, якщо відома чисельність сукупності N:        п =1 + 3,322 lg N

Використання формули Стерджеса n=1+3,322lgN

Кількість спостережень, N

Кількість рекомендованих груп, n

25 – 40

5 – 6

40 – 60

6 –

60 – 100

7 – 8

100 – 200

8 – 9

200 – 500

9 – 10

Понад 500

10 – 15

За величиною розрізняють інтервали рівні i нерівні. Рiвнi інтервали застосовують тоді, коли зміни кількісної ознаки всередині сукупності відбуваються рівномірно. Величину інтервалу при групуванні із застосуванням рівних інтервалів визначають за формулою:

де h – величина iнтервалу; хтах  – максимальне значення ознаки; хтin – мінімальне значення ознаки;  n – кiлькiсть груп.

У типологічних групуваннях розмір інтервалу визначають залежно від соціально-економічних властивостей явищ. У структурних групуваннях межі інтервалу і розмір груп визначаються або на підставі поступового укрупнення мінімальних груп (тобто складають ранжований – за зростанням або за зменшенням – ряд, потім здійснюють групування з мінімальним інтервалом, а потім ці інтервали укрупнюють), або з використанням стандартизованого підходу. Інтервал структурного групування визначається формулою:

де знаменник – формула Стерджеса для визначення кількості груп n за стандартизованим підходом.

У аналітичному групуванні для визначення розміру інтервалу використовуються такі методи:

1) метод рівних інтервалів – з використанням формул;

2) метод рівних частот – інтервали обирають таким чином, аби число одиниць сукупності розподілялось в них рівномірно.

Нерiвними називають інтервали, в яких різниця між верхньою i нижньою межею неоднакова. Нерiвнi інтервали застосовують тодi, коли варіація групувальної ознаки відбувається нерівномірно і в дуже  широких межах; вони можуть бути зростаючими i спадними.

Розрiзняють iнтервали закритi i вiдкритi. Закритими є iнтервали, в яких визначенi максимальнi i мiнiмальнi межi. Вiдкритими називаються iнтервали, у яких максимальнi або мiнiмальнi значення ознаки заздалегiдь невiдомi. Тому при групуваннi перший i останнiй iнтервали залишаються вiдкритими, наприклад, групування робiтникiв за стажем роботи: до 3 рокiв, 3-5, 5-10, 10-20, бiльше 20 рокiв.

4. Ряди розподiлу.

Результати зведення i групування можна оформляти у вигляді рядів розподілу, статистичних таблиць i графіків.

Статистичний ряд розподілу – це ряд, який характеризує розподіл одиниць сукупності по групах за будь-якою ознакою, різновидності якої розташовані у певному порядку.

Ряди розподілу складаються з двох елементів – варіанта і частоти.

Варіанта – окреме значення групувальної ознаки, а частоти – кількість елементів у групі з відповідним значенням ознаки. Накопичену частоту (частку) називають кумулятивною. Частота (f) – кількість окремих варіантів, тобто число, що показує, яку кількість разів або як часто зустрічаються ті чи інші варіанти. Сума всіх частот дорівнює загальній кількості одиниць. Частість (w) – частота, виражена у частках одиниць або у процентах до підсумку. Сума частостей дорівнює 1 або 100%.

Залежно вiд статистичної природи групувальної ознаки (якісна чи кiлькiсна) ряди розподілу поділяють на атрибутивні та варiацiйнi. Ряд розподілу, утворений за якiсною (атрибутивною) ознакою, називається атрибутивним.

Ряд розподілу сукупності за ознакою, що має кiлькiсне вираження, називається варiацiйним. Варiацiйнi ряди залежно від групувальної ознаки поділяють на дискретні i iнтервальнi. За дискретною ознакою, кількість значень якої обмежена, утворюється дискретний ряд розподілу.

За дискретною ознакою, що варіює в широких межах, або за неперервною ознакою будують інтервальний ряд розподілу. При цьому варіанти об’єднуються в інтервали, а частоти (частки) відносяться не до окремого значення ознаки, як у дискретних рядах, а до всього інтервалу.

За характером розподiлу варiацiйнi ряди бувають симетричними i асиметричними. Ряд розподiлу, в якому частоти спочатку наростають, а потiм так само спадають, називають симетричними. Якщо ж розмiщення частот в обидвi сторони вiд середньої неоднакове, такий ряд називають асиметричним, або скошеним.

Ряди розподiлу допомагають дослiджувати структуру явищ. Вони мають самостiйне значення при вивченнi варiацiї групувальної ознаки.

Для унаочнення часто користуються різними способами графічного зображення варiацiйних рядів. Варiацiйний ряд можна зобразити у виглядi полiгона i гiстограми.

Полiгон застосовується в основному для зображення дискретних рядiв розподiлу. При побудовi полiгону на вiсь абсцис вiдкладають значення ознаки (варiанти), а на вiсь ординат – абсолютнi або вiдноснi показники чисельностi одиниць сукупностi (частоти).

Гістограма розподiлу здебiльшого застосовується для зображення iнтервальних рядiв. Для її побудови на вiсь абсцис вiдкладаються iнтервали ознаки, а на вiсь ординат – частоти.

.


Тема 4. ПОДАННЯ СТАТИСТИЧНИХ ДАНИХ: ТАБЛИЦІ, ГРАФІКИ, КАРТИ.

План лекції

  1.  Статистичні таблиці, їх значення в статистиці, види таблиць. Вимоги до побудови таблиць
  2.  Основні види графіків. Картограми і картодіаграми.

1. Статистичні таблиці, їх значення в статистиці, види таблиць. Вимоги до побудови таблиць

Статистична таблиця це система рядків та стовпців, в яких у певній послідовності і зв’язку викладається статистична інформація про соціально-економічні явища.

Подібно до граматичного речення у статистичній таблиці розрізняють підмет i присудок. У підметі таблиці вказується об’єкт, який характеризується рядом числових показників (статистична сукупність в цілому, або одиниці сукупності, або групи одиниць). Система показників, що характеризують статистичну сукупність, є  присудком таблиці.

Обов’язковими атрибутами статистичної таблиці є загальний i внутрiшнi заголовки. Сукупність горизонтальних рядків i вертикальних граф без наведення числових даних утворює  м а к е т  статистичної таблиці:

Макет статистичної таблиці

Загальний заголовок

№ з/п

Внутрішній заголовок, що розкриває зміст підмету

Верхні внутрішні заголовки, що розкривають зміст граф таблиці

1

2

3

4

5

6

7

1

2

Бічні внутрішні заголовки, що розкривають зміст окремих рядків

...

Числові показники (присудок)

5

6

Підсумок

За побудовою підмета таблиці поділяють на три види – прості, групові  i комбiнацiйнi.

Підмет простої таблиці містить об’єкт дослідження, який не підрозділяється на групи, а подається або перелік всіх одиниць сукупності, або вказується вся сукупність в цілому.

Серед простих таблиць розрізняють: спискові; територіальні; хронологічні.

Групові таблиці вiдрiзняються тим, що у пiдметi об’єкт дослідження підрозділяється на групи за однією ознакою. У присудку вказується число одиниць у групах (абсолютне і відносне у %) та зведені показники по групах.

У підметі комбiнацiйних таблицях сукупність підрозділяється на групи не за одною, а за декількома ознаками. Інколи в комбiнацiйних таблицях групи за однією ознакою розміщують у пiдметi, а за другою – у присудку.

Розробка присудка таблиці може бути простою і складною (комбінованою). При простій розробці присудка показники, що характеризують підмет, розміщуються послідовно один за другим. Розподіляючи показники на групи за однією або більше ознаками у певній комбінації, одержують складний присудок.

За метою дослідження та призначенням статистичні таблиці поділяють: описово-інформаційні; аналітичні; типологічні; спеціального призначення.

При складанні статистичних таблиць слід дотримуватись таких основних правил їх побудови та оформлення:

  1.  Таблиця має бути компактною і містити лише ту інформацію, яка безпосередньо характеризує об’єкт дослідження.
  2.  Назва таблиці, заголовки рядків і граф мають бути стислими, чіткими і лаконічними. Крім загальноприйнятих скорочень одиниць вимірювання, скорочення слів у заголовках не допускається. Якщо назви окремих граф (рядків) повторюються, мають однакові терміни або однаковий зміст, то їх доцільно об’єднати спільним заголовком.
  3.  У таблиці обов’язково слід вказувати одиниці вимірювання показників.
  4.  Рядки в пiдметi i графи в присудку, як правило, нумерують.
  5.  Точно додержуватись таких умовних позначень щодо відсутності даних у таблиці відповідно до причин:
    •  якщо клітинка таблиці не може бути заповнена, ставиться знак «х»;
    •  коли відомості про явище відсутні, ставиться три крапки «...» або “»н.від.»;
    •  відсутність самого явища позначається тире “–“;
    •  дуже малі числа записуються (0,0) або (0,00).
  6.  Кiлькiснi показники в межах однієї графи повинні наводитися з однаковою точністю, тобто до 0,1, до 0,01, до 0,001.

7. Таблиці повинні бути замкненими.

2. Графiчнi способи зображення статистичних даних. Види графіків.

Статистичний графік – це система подання інформації про соціально-економічні явища за допомогою наочного зображення статистичних числових величин та їх співвідношень з використанням знакових систем: крапок, знаків, ліній, геометричних фігур, малюнків з метою їх узагальнення і подальшого аналізу.

Графiчнi зображення рiзноманiтнi, але всі вони мають однакові складові елементи: поле графіка, графічний образ, просторові i масштабні орієнтири.

Поле графiка – це простір, у якому розміщуються геометричні або інші графiчнi знаки.

Графічний образ – це сукупність геометричних або графічних знаків, за допомогою яких відображуються статистичні дані.

Просторові орієнтири використовують для визначення порядку розміщення графічних знаків у полi графіка.

Масштабні орієнтири (масштаб, масштабна шкала i масштабний знак) застосовують для визначення розмiрiв геометричних та інших графічних знаків.

Масштаб – це умовна міра переводу числового значення статистичної  величини у графічну, i навпаки.

Масштабна шкала – це лiнiя, поділена вiдповiдно до прийнятого масштабу.

За загальним призначенням графіки поділяють на аналiтичнi, iлюстративнi та iнформацiйнi.

За функцiонально-цiльовим призначенням видiляють графiки групувань i рядiв розподiлу, рядiв динамiки, взаємозв’язку i порiвняння.

На особливу увагу заслуговує класифікація статистичних графіків за видом їх поля, згідно з якою розрізняють такі групи: дiаграми (вiд грец. diagramma – зображення, рисунок, креслення) і статистичні карти або картограми, картодіаграми.

Найбільш поширеними є діаграми. Вони бувають різних видів: лінійні, стрiчковi, кільцеві, радіальні, точкові, площинні, об’ємні, фігурні.

Лінійні графіки доцільно розподіляти на ті, які використовуються для зображення даних за однією змінною – одномірні або за двома змінними – двохмірні.

Графіки поділяють на основні і спеціальні. Основні – це найбільш поширені графіки. Спеціальні – це графіки, які використовують для спеціальних цілей. Основні графіки поділяють на три види: стовпчикові, кругові, криві лінії.

Стовпчикові графіки відображають статистичні дані у вигляді прямокутників (стовпчиків) однакової ширини.

Розрізняють три основних види стовпчикових графіків: об’ємні, структурні та об’ємно-структурні. В об’ємних графіках висота кожного стовпчика пропорційна величині зображених явищ. Цифри, як правило, записують всередині стовпчиків або над ними. В структурних графіках висота кожного стовпчика однакова і складає 100 % або 1. Стовпчик ділять на частини пропорційно структурі зображеного явища. Об’ємно-структурний графік об’єднує об’ємний та структурний графік.

Різновидами стовпчикових графіків є гістограма розподілу і стрічковий графік. Гістограма розподілу – це стовпчиковий графік, на осі абсцис якого відкладають рівні або нерівні інтервали розподілу будь-якого явища, а на осі ординат – висоту стовпчиків, яка пропорційна кількості одиницьсукупності у відповідному інтервалі або їх частоті у відсотках до загального підсумку. Якщо стовпчики розміщені горизонтально, графік називається стрічковим. Довжина рядка у стрічковому графіку пропорційна величині показника.

Кругові графіки відображають статистичні дані у вигляді площі круга. Розрізняють три основних види кругових графіків: об’ємні, структурні (секторні) та об’ємно-структурні. В об’ємних графіках площа круга пропорційна величині зображеного показника. В структурних графіках площу круга приймають за 100%, із розрахунку, що 1% дорівнює куту 3,6°. Виходячи з цього, круг ділять на сектори пропорційноструктурі зображеного явища. Об’ємно-структурний графік об’єднує об’ємний та структурний графіки. На практиці найчастіше використовують структурні (секторні) кругові графіки. 

Криві – це графіки у формі різних кривих, які будують у системі прямокутних координат. Розрізняють три основних види кривих: графіки динаміки, залежності та розподілу.

Графіки динаміки показують зміни статистичних даних у часі. Графіки залежності – характеризують залежність одних явищ від інших. Наприклад, залежності ціни товару від його якості.

Графіки розподілу показують розподіл статистичної сукупності за певними ознаками. Прикладом таких графіків є полігон розподілу. Полігон розподілу – це крива лінія, для побудови якої на осі абсцис відкладають значення певної ознаки, а на осі ординат – розподіл за цією ознакою кількості одиниць сукупності або їх частоті у відсотках до загального підсумку. Полігон розподілу можна об’єднувати з гістограмою.

Картограма – це географічна карта, на якій досліджується територіальний розподіл статистичної сукупності по певній ознаці, шляхом нанесення її значень крапками, штрихуванням, зафарбовуванням різними кольорами тощо. Наприклад, за допомогою картограм можна зобразити розподіл по регіонах усіх видів ресурсів, продукції, інвестицій, урожайності, щільності населення, рівня його зайнятості і т.ін.

Картодіаграма – це географічна карта, у різних частинах якої побудовані локальні графіки (діаграми) у формі стовпчиків, кіл тощо. Фігурні графіки – це різні графічні фігури певного масштабу, які нагадують зображені явища.

Наприклад, для показника виробництва автомобілів це може бути зображення автомобіля різної величини з відповідною цифрою їх випуску.

Радіальні діаграми – це коло з масштабом часових чи інших інтервалів, на радіусах якого відображують зміну величини статистичних показників. Радіальні діаграми застосовують для аналізу коливань показників у часі.

Графік В.Є. Варзара показує розміри відразу трьох показників, які пов’язані між собою так, що добуток перших двох дорівнює третьому: х12 у. Графік В.Є. Варзара – це прямокутник, основою якого є один показник(х1), висотою – другий (х2), а їх добуток – площа прямокутника – третій (у).


Тема 5. УЗАГАЛЬНЮЮЧІ  СТАТИСТИЧНІ ПОКАЗНИКИ.

Відносні величини.

План лекції

  1.  Сутність і значення статистичних показників. Показник і його атрибути.
  2.  Поняття про абсолютні величини. Види абсолютних величин.
  3.  Відносні величини, їх суть та форми вираження. Основні види відносних величин.

1. Сутність і значення статистичних показників. Показник і його атрибути. Функції статистичних показників.

Оскільки статистика вивчає масові явища, статистичний показник – це узагальнююча характеристика якоїсь властивості сукупності, групи.

Якісний зміст показника залежить від суті явища (процесу) і знаходить своє відображення у назві показника (народжуваність, прибутковість тощо). 

Кількісна сторона показника представлена числом та його одиницею вимірювання.

Атрибути статистичного показника:

Якісна сторона: об’єкт, його властивості

Кількісна сторона: число та одиниці вимірювання

Територіальні, галузеві і інші межі об’єкта

Інтервал або момент часу

Зупинимось на співвідношенні між ознакою і статистичним показником.

Ознака – це властивість, яка характерна одиниці сукупності.

Показник – характеристика групи одиниць, або сукупності в цілому.

Статистичний показники – це узагальнююча характеристика соціально-економічного явища чи процесу, в якій поєднуються якісна та кількісна визначеність останнього.

2. Класифікація статистичних показників.

Таблиця 1. Класифікація статистичних показників.

За якісною ознакою

За кількісною стороною показника

Відносно до властивості, яку характеризують

Показники властивостей конкретних об’єктів

Абсолютні

Прямі

Показники статистичних властивостей будь-яких масових явищ і процесів

Відносні

Обернені

Статистичні показники підрозділяються на абсолютні і відносні величини.

Поняття про абсолютні величини. Види абсолютних величин

Узагальнюючі показники можуть бути абсолютними, відносними і середніми величинами. 

Абсолютні статистичні величини безпосередньо пов’язані з фізичною і соціально-економічною суттю явищ, які вивчають. Абсолютнi статистичні величини це кiлькiснi показники, які характеризують розміри (рiвнi, обсяги) суспільних явищ у певних умовах місця i часу. Отримують їх методами статистичного спостереження і зведення вихідної інформації.

Абсолютні величини завжди є іменованими числами. Іменовані числа являють собою вимірники ознак. Розрізняють три види вимірників – натуральні, вартісні і трудові. 

Натуральними називаються такі одиниці виміру, які відповідають природним (фізичним) властивостям даного предмета і виражаються в мірах довжини, площі, об’єму, маси тощо або кількістю одиниць (штук), кількістю фактів чи подій.

У разі потреби зведення воєдино декількох різновидів однієї споживної вартості використовують умовно-натуральні одиниці виміру. При цьому вживають спеціальні перерахункові коефіцієнти, що

Для різнойменної продукції загальний обсяг виробництва (реалізації) визначають у вартісному (грошовому) вираженні. Вартісні (грошові) вимірники використовуються не лише на рівні окремого суб’єкта господарювання, а й на рівні галузей чи економіки в цілому.

Для визначення обсягу трудових ресурсів чи витрат праці на виробництво продукції, а також для оцінки трудомісткості продукції використовуються трудові вимірники (людино-година, людино-день). 

Абсолютнi статистичнi  величини подiляються на iндивiдуальнi  i підсумкові (сумарнi).

Iндивiдуальнi абсолютні величини характеризують  величину ознаки окремих одиниць сукупності.

Підсумкові (сумарні) абсолютні величини характеризують величину ознаки певної сукупності i кiлькiсть одиниць сукупності

3. Відносні величини, їх суть та форми вираження.

В аналізі статистичної інформації поруч з абсолютними величинами важливе місце посідають відносні величини.  

Відносними статистичними величинами називають показники, які виражають кiлькiсне спiввiдношення мiж явищами суспільного життя. Будь-який відносний показник одержують в результаті співставлення двох величин

Кожна відносна величина являє собою частку від ділення двох величин. При обчисленні відносних величин слід мати на увазі, що чисельник – це показник, який вивчається – звітна величина. Та величина, з якою проводиться порівняння – основа, або база порівняння.

Залежно від того, до якого значення прирівнюється база порівняння, частку від ділення однойменних величин можна виразити або у вигляді коефіцієнта чи відсотка, або як проміле чи продециміле.

Основні види відносних величин

Вiдноснi величини, в залежностi вiд їх пiзнавального значення, подiляють на такi види:

  •  Вiдноснi величини планового завдання (прогнозування);
  •  Вiдноснi величини виконання плану (прогнозiв, договiрних зобов’язань, державних замовлень);
  •  Вiдноснi величини динамiки;
  •  Вiдноснi величини структури;
  •  Вiдноснi величини координацiї;
  •  Вiдноснi величини порiвняння;
  •  Вiдноснi величини iнтенсивностi.

Вiдноснi величини планового завдання (прогнозування) характеризують передбачуваний розмiр збiльшення або зменшення розмiрiв явища за планом (прогнозом) в наступному перiодi порiвняно з базисним (одним iз  попереднiх перiодiв, прийнятих за базу

Вiдноснi величини виконання плану (договiрних зобов’язань, державного замовлення)  характеризують рiвень виконання прогнозних розрахункiв, їх одержують шляхом порiвняння фактично досягнутого рiвня у звiтному перiодi з рiвнем,  передбаченим планом (договорами  або державним  замовленням).

Вiдносними величинами динамiки називаються показники, які виражають ступінь зміни розмiрiв явища у часi. Вони характеризують напрям і швидкість зміни явищ у часі, темпи їх розвитку. показника від періоду, який взято за базу порівняння.

Розглянемо наступний приклад. У 2009 р. магазином було продано продовольчих товарів на суму 275 тис. грн, планом на 2010 р. передбачалось продати на 300 тис. грн, фактично було продано на 330 тис. грн.

  1.  Відносна величина планового завдання (В пз.)

В пз =

  1.  Відносна величина виконання плану (В вп.)

В вп. =

  1.  Відносна величина динаміки (В д)

В д =

Відносні величини планового завдання, виконання плану та динаміки пов’язані між собою таким чином:

        або       

Наприклад. У поточному році порівняно з базовим випуск продукції на підприємстві зріс на 4,5 %, планом передбачалось підвищити його на 5,6 %. На скільки відсотків фактично перевиконано чи недовиконано планове завдання з випуску продукції?

Вiдноснi величини структури – це спiввiдношення розмiрiв частини i цілого,  вони характеризують склад досліджуваної сукупності. Вiдноснi величини структури визначаються як відношення абсолютної величини кожного iз елементів сукупності до абсолютної  величини

Для обчислення відносних величин структури використаємо дані про склад населення Львівської області:

2005 рік

2006 рік

2005 рік

2006 рік

Все населення, тис осіб

2588,0

2577,1

у тому числі

– міське

1549,8

1549,5

– сільське

1038,2

1027,6

Порiвнюючи структуру населення за два перiоди, можемо прослiдкувати структурнi змiни. Рiзниця мiж вiдповiдними частками називається вiдсотковим пунктом. У наведеному прикладi за 1 рік вiдбулися змiни в структурi населення за мiсцем проживання у бік збiльшення питомої ваги мiського населення. З 1991 року по 2001 рiк питома вага мiського населеня зросла на 0,25%пункти (60,13 – 59,88) і відповідно на стільки ж зменшилася  питома вага сільського населення (39,87 – 40,12 = –0,25).

Вiдноснi величини координацiї застосовуються для характеристики спiввiдношення між окремими частинами статистичної сукупності i показують у скільки разів порівнювана частина більша або менша частини, що прийнята за базу порівняння.

Вiдноснi величини порiвняння обчислюють як спiввiдношення однойменних показників, що характеризують рiзнi об’єкти (підприємства,  галузі) або території (мiста, регiони, країни) i мають однакову часову визначенiсть.

Вiдноснi величини iнтенсивностi характеризують ступінь поширення чи розвитку явища в певному середовищі. Вони обчислюються як спiввiдношення двох рiзноймених величин: абсолютної величини дослiджуваного явища i абсолютної величини, що характеризує об’єм середовища, в якому вiдбувається розвиток або розповсюдження  явища..

Задача 1. За поточний рік підприємство випустило таку кількість мила та миючих засобів:

Види мила та миючих засобів

Кількість виробленої продукції, кг

Мило господарське 72% жирності

1200

Мило господарське 60% жирності

900

Мило туалетне 80% жирності

2100

Пральний порошок 10% жирності

2500

Визначити загальну кількість виробленої продукції підприємством в умовно-натуральних одиницях вимірювання. За умовну одиницю обчислювання треба брати мило 40-%ої жирності.

Задача 2. Є такі дані по підприємству:

Показники

Минулий

рік

Поточний рік

За планом

Фактично

1. Виробництво продукції, тис. грн..

707,0

715,0

719,7

2. Загальні витрати часу, тис. людино-год

787,8

746,8

768,8

3. Загальні витрати на виробництво, тис. грн..

580,5

597,6

600,1

Визначити відносні величини планового завдання, виконання плану та динаміки за цими показниками. Зробити висновки.

Задача 3. За наведеними даними обчислити відносні величини інтенсивності і порівняння.

Країна

Територія,

тис.км2

Чисельність населення, тис.осіб

Валовий внутрішній

продукт, млн.дол.

А

912

16390

32483

Б

1285

18710

16866

Задача 4. На основі даних про розподіл населення регіону за віком та типом поселення визначити відносні величини, які б характеризували: а) структуру міського і сільського населення за ознакою працездатності, проведіть порівняльний аналіз структур; б) співвідношення працездатного і непрацездатного населення у містах і селах; в) структуру населення за типом поселень; г) співвідношення міського і сільського населення. Зробити висновки.

Вік

млн. осіб

міське

сільське

Допрацездатний

0,8

0,4

Працездатний

2,0

0,8

Старше працездатного

0,6

0,5

Разом

3,4

1,7

Задача 5. Планом передбачалось збільшення реалізації продукції на 10%, а фактично реалізовано на 15,5% більше, ніж у базисному періоду. Визначити ступінь виконання плану для обсягу реалізації.

Задача 6. Планове завдання щодо обсягу виробництва на 2008 р. порівняно з фактичним обсягом виробництва за 2007 р. склало 105%. Виконання плану складає 102%. Знайти коефіцієнт динаміки.

Задача 7. Відомі такі дані по району: кількість дітей які народились за рік складає 1701 дитина; середньорічна чисельність населення – 94980 осіб. Визначити відносну величину інтенсивності, яка характеризує народжуваність дітей.

Задача 8. Планове завдання передбачало зниження собівартості за рік на 5%, а фактично вона знизилася на 8 %. Визначити виконання плану зі зниження собівартості.

Задача 9. Ціна соняшникової олії на внутрішньому і світовому ринках становила, дол. США за 1 т:

Місяць

Внутрішній ринок

Світовий ринок

Лютий

724

695

Серпень

759

690

Провести порівняльний аналіз цін на олію, зазначте види використаних відносних величин за аналітичною функцією.



Тема 5.
УЗАГАЛЬНЮЮЧІ  СТАТИСТИЧНІ ПОКАЗНИКИ. СЕРЕДНІ  ВЕЛИЧИНИ

План лекції

  1.  Поняття про середні величини та їх значення  в статистиці.
  2.  Види середніх величин.
  3.  Середня арифметична проста і зважена.
  4.  Середня гармонічна та умови її застосування.
  5.  Середня прогресивна.
  6.  Структурні середні. Багатовимірні середні.

1. Поняття про середні величини та їх значення в статистиці

Середня  величина це узагальнююча міра варіюючої ознаки, що характеризує її рівень в розрахунку на одиницю сукупності. Умови застосування середніх величин: наявність якісно однорідної сукупності та достатньо великий її обсяг.

У статистичній практиці використовують декілька видів середніх: середня арифметична, середня гармонічна, середня геометрична, середня квадратична і т.д.  Кожна із зазначених середніх може набувати дві форми: просту і зважену. Проста застосовується в разі обчислення середньої за первинними (незгрупованими) даними, а зважена – за вторинними (згрупованими) даними.

Використання кожного виду середніх залежить від двох обставин, по-перше, від характеру індивідуальних значень ознаки (прямі, обернені, квадратичні, відносні) . По-друге, від характеру алгебраїчного зв`язку між індивідуальними значеннями ознаки та її загальним обсягом (сума, добуток, степінь, квадратичний корінь). Цей зв`язок  є визначальною  властивістю  сукупності і відбивається в логічній формулі осереднювальної ознаки. На підставі логічної формули  обирається вид середньої.

Основне завдання середніх величин полягає в їх узагальнюючій функції, тобто заміна множини різних індивідуальних значень ознаки середньою величиною, яка характеризує всю сукупність явищ. Всім відомі особливості розвитку сучасних людей, які проявляються в тому числі і більш високому зростанні синів порівняно з батьками, дочок

Якщо середня величина узагальнює якісно однорідні значення ознаки, то вона є типовою характеристикою ознаки в даній сукупності. 

Середня величина – це узагальнююча характеристика сукупності однотипних одиниць за певною кiлькiсною ознакою. Вона характеризує типовий рівень варiюючої ознаки i відображає те спільне, характерне, що об’єднує всю масу елементів, тобто статистичну сукупність. За допомогою середньої величини відбувається згладжування відмінностей величини ознаки, які виникають

Сутність середньої можливо розкрити за допомогою її визначальної властивості: середня як узагальнюючий показник усієї статистичної сукупності має орієнтуватись на відповідну величину, пов’язану з усіма одиницями цієї сукупності. Цю величину можна подати у вигляді функції . Оскільки ця величина у більшості випадків відображає реальну економічну категорію, її називають визначальним показником.

Середня величина – величина абстрактна, тому що характеризує значення ознаки абстрактної одиниці і може не збігатися з жодним з індивідуальних значень ознаки. Абстрагуючись від індивідуальних особливостей окремих елементів, можна виявити те загальне, типове, що притаманне всій сукупності в конкретних умовах місця і часу.

Критерієм розрахунку середньої величини є правильний вибір початкової бази обчислень, яка відображає зміст середньої величини та її зв’язок з іншими показниками. Розрахунок середніх величин повинен бути підпорядкований соціально-економічному змісту явищ, реально відображати істотну характеристику суспільного явища.

2. Види середніх величин

Середні величини в статистиці належать до класу степеневих середніх. Середня степенева т-го степеня порядку х1, х2, … хп визначає формула:

де х – рівень ознаки, варіанти;  n число варіантів; m – показник степеня середньої.

Зміна степеня середньої величини визначає її вигляд:

при  m = –1   –  середня

при  m =  0    –  середня

при  m =  1    –  середня

при  m =  2    –  середня

Із степеневих середніх у статистиці найчастіше використовують середню арифметичну, рідше – середню гармонічну, середню геометричну – тільки для обчислення середніх темпів динаміки, а середню квадратичну – для розрахунків показників варіації. Середню кубічну для статистичних розрахунків майже не використовують.

Правило мажорантності середніх: Чим вище показник ступеня т, тим більшим буде розмір самої середньої, тобто Х гарм< Х геом< Х арифм< Х квадр

Правильну характеристику окремих сукупностей можна отримати лише через використання певних видів середньої. Для встановлення виду середньої використовують її визначальну властивість – при заміні всіх значень варіантів середньою величиною обсяг ознаки не зміниться.

У багатьох випадках середню найзручніше визначити через вихідне (логічне) співвідношення середньої (ВСС):

ВСС= чисельніст ь одиниць сукупності / обсяг варіативно ї ознаки = середня агрегатна

Для кожного показника, використовуваного у соціально-економічному аналізі, можна розрахувати тільки одну середню агрегатну. Однак алгоритм побудови ВСС залежить від способу представлення вихідних даних. Розрахунок більшості конкретних статистичних показників оснований на використанні середньої агрегатної, середньої арифметичної і середньої гармонічної.

3.  Середня арифметична проста і зважена

Середня арифметична – використовується для осереднення прямих значень ознак шляхом їх підсумування. Логічна формула середньої арифметичної має вигляд:

.

Чисельник логічної формули середньої являє собою визначальну властивість, яка є реальною абсолютною чи відносною величиною і має  самостійне значення в аналізі.

Середня арифметична може бути простою і зваженою. Розглянемо розрахунок середньої арифметичної  простої на прикладі.

Статутний фонд акціонерної компанії сформований 6-ма засновниками; розмір внеску кожного з них становить, млн. гр.од.: 6; 10; 12; 9; 7; 4. Знайти середній внесок одного засновника:

де хі   – індивідуальні значення ознаки окремих одиниць сукупності; п –  кількість одиниць сукупності.

Наведена формула має назву середньої арифметичної простої і застосовується тоді, коли розрахунок здійснюють на основі первинних, незгрупованих даних.

Наприклад, наведені дані про загальну кількість забитих м’ячів вищої ліги України:

Розподіл футбольних м’ячів вищої ліги України за кількістю забитих м’ячів двома командами в 2004р

Кількість забитих м’ячів

0

1

2

3

4

5

6

7

8

9

10

Разом

Кількість матчів

21

46

53

51

34

16

14

4

-

-

1

240

У наведеному ряді розподілу варіанти – це кількість забитих м’ячів. Кожна з варіант має відповідну частоту, тобто кількість матчів. При обчисленні середньої за даними варіаційного ряду розподілу для визначення загального обсягу ознаки слід кожну з варіант помножити на частоту і отримані результати додати. Таке множення варіантів на їхні частоти в статистиці називають зважуванням, а обчислена в такий спосіб середня – середньою арифметичною зваженою.

Обчислення середньої арифметичної зваженої в наведеному прикладі матиме такий вигляд:

Якщо частоту (вагу) позначити f, то формула середньої арифметичної зваженої матиме такий вигляд:

де хі – індивідуальні значення ознаки окремих груп варіаційного ряду розподілу (варіанта); fi – частоти або частки ряду розподілу.

Обчислюється за згрупованими даними, коли вихідна інформація наведена у вигляді дискретного або інтервального варіаційного ряду розподілу.

В інтервальних рядах розподілу для обчислення середньої величини насамперед слід визначити центр інтервалу в кожній групі. Середнє значення інтервалу 

Якщо в рядах розподілу є відкриті інтервали, то


Таблиця 1.  
Розподіл економічно активного населення за віком у 2003р.

Вікові групи

Відсоток за віковими групами

f

Центр інтервалу

х і

xf

До 25

12,6

25–30

13,3

30–40

26,3

40–50

27,6

50–60

15,1

60 і більше

5,1

Р а з о м

100

Середній вік економічно активного населення у 2003р за формулою середньої арифметичної зваженої:

5. Середня гармонічна та умови її застосування

Користуються таким практичним правилом: якщо інформація про значення знаменника логічної формули (ваги) наведена – застосовується середня арифметична зважена. В разі відсутності даних про ваги -  використовується середня гармонічна зважена.

Середня гармонічна використовується при розрахунку середньої з обернених показників шляхом їх підсумування Для незгрупованих даних береться середня гармонічна проста:

.

За змістом середня гармонічна – це перетворена середня арифметична зважена. Її використовують тоді, коли показники частоти (f), які виступають статистичною вагою, відсутні, але відомі добутки ознаки (х) на ваги  (f), тобто показник  (= х f). Розглянемо приклад розрахунку середньої гармонічної.

Заробітна плата продавців у магазині

Секції

Березень

Жовтень

Середня заробітна плата, грн.

Кількість продавців

Середня заробітна плата, грн.

Фонд заробітної плати, грн.

Одяг

2200

10

2300

27600

Взуття

2400

9

2500

17500

Меблі

2500

12

2700

40500

Тканини

2700

8

3000

18000

Для визначення середньої заробітної плати за варіаційну ознаку х правлять показники середньої заробітної плати кожної секції магазину, а фонд заробітної плати – це добуток варіант (заробітна плата) у відповідних секціях на їх частоти (кількість продавців), = хf. Отже, обчислювати середню заробітну плату у жовтні місяці у цілому треба за формулою середньої гармонічної зваженої:

6.  Середня прогресивна

У практиці планування, розрахунку нормативів часто вдаються до визначення середньої прогресивної. Відомо, що при обчисленні загальної середньої для розрахунку беруть всі варіанти. При розрахунках середньої прогресивної враховують тільки кращі показники з точки зору інтересів виробництва.

Для обчислення середньої прогресивної діють таким чином. З усього ряду варіант (значень ознаки) будують ранжирований ряд і знаходять їх середнє значення, яке ділить ряд на дві частини: частина значень ряду нижче загальної середньої і частина ряду вище загальної середньої.

При обчисленні середніх прогресивних можливі два випадки:

Перший випадок.  Кращими будуть показники ранжированого ряду, які є вищими від загальної середньої. Наприклад: урожайність, денний виробіток робітника, рентабельність.

У цьому випадку середню прогресивну визначають так:

  •   з усіх варіант   визначають загальну середню  ;
  •  відбирають кращі індивідуальні показники, тобто ті, які перевищують загальну середню;
  •  за кращими показниками обчислюють нову середню, яка і буде середньою прогресивною.

Приклад: 15 працівників майстерні за зміну виготовляли таку кількість деталей:

20; 25; 18; 33; 19; 28; 21; 31; 26; 29; 30; 32; 24; 35; 27.

Слід визначити середню прогресивну норму виробітку одного працівника.

1. Будуємо ранжирований ряд із показників виробітку деталей робітниками майстерні:

2. Визначаємо загальну середню за формулою    :

3. Визначаємо середню прогресивну з тих варіант ранжированого ряду, які знаходяться вище …….

Отже, при нормуванні виробітку треба брати і не 18 деталей (хmin) і не 35 деталей (хmax), а лише 31 деталь, тобто ту кількість, яка є найбільш обгрунтованою із урахуванням як кваліфікації робітників, так і умов виробництва. Середній виробіток за зміну в кількості 31 деталь і буде середньою прогресивною.

Другий випадок. Характер показників такий, коли кращими будуть показники ранжированого ряду, які знаходяться нижче від загальної середньої.

7. Порядкові (структурні) середні. Багатовимірні середні.

Середні арифметична і гармонічна є узагальнюючими характеристиками сукупностей за тією чи іншою варіаційною ознакою. Водночас структуру цих сукупностей характеризують особливими показниками, які називають у статистиці структурними або порядковими середніми величинами. Зокрема, це мода і медіана. Структурні (порядкові) середні – це значення будь-яких одиниць статистичної сукупності, вибраних в результаті їх особливої позиції у сукупності.

Мода (Мо) – це значення ознаки (варіанта), яка найчастіше зустрічається у даній сукупності.

Медіаною (Ме) у статистиці називають варіанту, що є серединою впорядкованого варіаційного ряду розподілу, тобто ділить його на дві рівні частини: одна частина має значення варіюючої ознаки менше ніж середня, а друга – більше.

Мода і медіана, на відміну від степеневих середніх, є конкретними характеристиками варіаційного ряду, мають певні значення, і тому їх ще називають описовими характеристиками. Описові характеристики завжди відповідають певній варіанті. Мода і медіана не є типовими характеристиками для дослідження однорідних сукупностей з великою чисельністю одиниць.

Модою у дискретному ряді розподілу є варіанта, яка має найбільшу частоту.

У рядах розподілу, в яких не одна, а дві варіанти однаково модальні, тобто мають найбільші частоти, означає, що є дві моди – розподіл бімодальний.

Наприклад, розглянемо дані щодо розподілу за розмірами продажу чоловічих костюмів.

Продаж чоловічих костюмів

Розмір костюма

44

46

48

50

52

54

56

Кількість проданих костюмів

2

8

20

91

44

19

5

За цими даними найбільшим попитом у покупців користуються

Медіаною у дискретному ряді розподілу буде значення ознаки, кумулятивна частота (Sfi) якої перевищує половину обсягу сукупності (Sfi0,5Σfi). Кумулятивна частота визначається в результаті послідовного об’єднання груп і підсумовування відповідних їм частот. Кумулятивна частота характеризує обсяг сукупності зі значеннями варіант, які не перевищують значень групувальної ознаки (хі). Для визначення медіани можна скористатися також такою формулою (номер медіани):

У наведеному вище прикладі кількість покупців костюмів становить 189 чоловік, тоді номер медіани становить (189+1):2=95, тобто варіанта за номером 95 ділить упорядкований ряд на дві однакові частини.

Для знаходження модальної величини, що міститься в певному інтервалі, формула має такий вигляд:

де  x0  –  мінімальне значення ознаки в модальному інтервалі; iMo  –  величина модального інтервалу; fMo   –  частота модального інтервалу; fMo-1  –  частота інтервалу, що передує модальному; fMo+1  –  частота інтервалу наступного за модальним.

Модальний інтервал визначається за графою частот: інтервал, що відповідає найбільшій частоті, і є модальним.

Наприклад, розглянемо результати вибіркового обстеження робітників одного із цехів заводу за стажем роботи (табл. 4).

Таблиця. Розподіл робітників цеху за стажем роботи

Стаж роботи, років

Чисельність робітників

Кумулятивні частоти

До 3

40

3 – 6

125

6 – 9

230

9 – 12

225

12 – 15

144

15 і більше

36

Разом

800

Модальний інтервал становить від 6 до 9 років, частота, яка йому відповідає є максимальною. Підставивши дані, обчислимо моду:

Це означає,  що  такий стаж є найбільш поширеним, типовим для робітників цеху.

Медіана в інтервальному ряді розподілу визначається за формулою. В інтервальному ряді за принципом кумулятивної частоти визначають медіанний інтервал.

де x0 – мінімальне значення ознаки в медіанному інтервалі; i – величина медіанного інтервалу; Σfi – сума частот; SМе-1 – сума нагромаджених частот до медіанного інтервалу (кумулятивна частота передмедіанного інтервалу); f  –  частота медіанного інтервалу.

Для обчислення медіани спочатку в інтервальному ряді розподілу визначають медіанний інтервал. Він відповідає такому, кумулятивна частота якого дорівнює чи перевищує номер медіани.

У нашому прикладі номер медіани дорівнює: (800+1):2=400,5. Отже, медіана знаходиться в інтервалі від 9 до 12 років. Підставивши у формулу дані таблиці, обчислимо медіану:

Величина моди i медiани, як правило, вiдрiзняється вiд величини середньої i спiвпадає з нею тiльки у випадку симетрiї варiацiйного ряду.

Ще одним видом середніх величин є багатовимірна середня. З другої половини 20 ст. багатовимірні середні набули великого розвитку у формі різноманітних рейтингів різнорідних економічних та соціальних явищ. Рейтинги (R) часто визначають у відсотках (балах) від 0 до 100% за формулою середньої арифметичної зваженої, де xi - експертні оцінки значень різнорідних (різноякісних) факторів, що впливають на величину рейтингу (від 0 до 100%); f - вагомість факторів (у % до 100%).

Наприклад, експертні оцінки якості надання житлово-комунальних послуг населенню трьох міст становлять: міста А – 82%, міста В – 76%, міста С – 65%. Загальна кількість населення трьох міст – 3608 тис. осіб (100%). У тому числі міста А – 1353 тис. осіб (37,5%), міста В – 1186 тис. осіб (32,9%), міста С – 1069 тис. осіб (29,6%). Оскільки житлово-комунальні послуги надаються населенню міст, то вагомість якості цих послуг можна визначити за відповідною кількістю населення. У даному випадку багатовимірна середня становить:

R=(82 * 37,5)+(76 * 32,9)+(65 * 29,6)/100=75,0%.

Багатовимірна середня трьох міст дорівнює 75,0% від 100%. У місті А вона більше середнього рівня на 7% (82 – 75,0), у місті В – на 1%, а у місті С – менше на 10%.

Задача 1. Середній виробіток продукції одним робітником за зміну в двох цехах підприємства, які виробляють однорідну продукцію, характеризується такими даними, наведеними в таблиці. Визначити середньоденну продуктивність праці робітників: а) по першому цеху; б) по другому цеху. Зробити порівняльний аналіз.

№ бригади

Цех № 1

№ бригади

Цех № 2

Обсяг виготовленої продукції, шт.

Денна продуктивність праці, шт.

Денна продуктивність праці, шт.

Чисельність робітників, осіб

1

120

18

4

36

16

2

432

30

5

38

11

3

510

34

6

21

8

Задача 2. Виконання плану виробництва продукції характеризується даними на п'яти підприємствах галузі. Визначити середній відсоток виконання плану в цілому по підприємствах. Зробити висновки.

№ підприємства

Вироблено продукції, тис. грн

Вироблено, % до плану

1

19,1

94,7

2

11,5

101,4

3

25,7

100,2

4

8,3

93,5

5

9,7

102,0

Задача 3. Є такі дані про фінансові показники фірм за два періоди:

№ фірми

Минулий рік

Поточний рік

Прибуток на одну акцію, грн.

Кількість акцій, тис.

Прибуток на одну акцію, грн.

Сума прибутку, тис. грн.

1

30

60

40

3600

2

50

40

80

4800

Визначити середній прибуток на одну акцію по фірмах за минулий та поточний періоди. Зробити порівняльний аналіз.

Задача 4. Визначити середню кількість слів у зареєстрованих за добу телеграмах, модальне та медіанне значення, використовуючи такі дані:

Кількість слів у телеграмі

До 5

5–8

8–12

12–18

18–25

Більше 25

Число телеграм

55

92

148

104

67

34

Задача 5. За даними про ціни та обсяг продажу картоплі на трьох колгоспних ринках міста визначити середню ціну 1 кг картоплі за III квартал, IV квартал і за півріччя.

Ринок

ІІІ квартал

IV квартал

Ціна  за  1 кг, грн.

Продано, тонн

Ціна  за  1 кг, грн.

Продано на суму, тис.грн.

Галицький

0,75

50

1,10

51,7

Стрийський

0,60

45

1,00

40,0

Краківський

0,65

60

0,85

42,5

Задача 6. За наведеними даними визначити середню частку кредитів під заставу майна у загальній сумі кредиторської заборгованості банків. Обґрунтувати вибір форми середньої.

Відділення комерційних банків

Загальна сума кредиторської заборгованості, млн.гр.од.

Частка кредитів під заставу майна у загальній сумі кредиторської заборгованості, %

Центральні

270

30

Філії

180

50

Задача 7. Сума несплаченої своєчасно заборгованості за кредити на 1 липня становила 92,4 млн. гр.од. За окремими видами економічної діяльності вона розподілялася так:

Вид економічної діяльності

Сума несплаченої заборгованості, млн.гр.од.

Питома вага несплаченої заборгованості у загальному обсязі кредитів, %

А

32,0

20

В

14,0

28

С

46,4

16

Визначити середній процент несплаченої своєчасно заборгованості.

Для задач 8-10 визначити моду, медіану та середнє значення. Пояснити отримані результати.

Задача 8. Розподіл державних службовців в Україні за віком та статтю:

Вік державного службовця

Жінки (%)

Чоловіки (%)

до 27

25,4

22,7

28-54

61,3

64,0

55-59

12,5

12,4

60 і більше

0,8

0,9

Задача 9. Розподіл чисельності кандидатів наук за віком та статтю в Україні у 2004 р.:

Вік кандидата наук

Жінки (%)

Чоловіки (%)

до 30

7,3

4,0

31-40

23,7

12,6

41-50

28,8

23,1

51-55

12,7

14,7

56-60

9,8

14,0

61-70

14,9

25,9

70 і більше

2,8

5,7

Задача 10. Розподіл населення Жидачівського району Львівської області за статтю та віком станом на 1 січня 2004 р. (тис. осiб):

Вік (років)

Чоловіки

Жінки

0-15

6,8

6,4

16-34

10,1

9,8

35-54

10,3

10,1

55-59

1,8

2,1

60-70

3,8

5,5

71 і більше

3,8

8,1




Тема 6. АНАЛІЗ РЯДІВ РОЗПОДІЛУ.

План лекції

  1.  Поняття варіації та її основні показники.
  2.  Характеристики форми розподілу.

1. Поняття варіації та її основні показники. Варіація масових явищ.

Коливання окремих значень ознаки характеризують показники варіації. Термін «варіація» походить від латинського variatio – зміна, коливання, відмінність. Варіацією у статистиці називають кількісні зміни величини досліджуваної ознаки в межах однорідної сукупності, які зумовлені впливом дії різних факторів.

Ряд розподілу характеризує склад, структуру сукупності за певною ознакою. У співвідношенні варіантів та частот проявляється закономірність розподілу. Вона описується низкою статистичних характеристики, зокрема:

  •  частотні характеристики (абсолютна чисельність певної групи – частота даної групи та відносна частота);
  •  характеристики центру розподілу середня, мода і медіана;
  •  характеристики варіації;
  •  характеристики нерівномірності розподілу, концентрації, асиметрії.

Показники варіації:

1) доповнюють середні величини, за якими приховані індивідуальні значення ознак, оскільки середні не показують будову сукупності;

2) характеризують ступінь однорідності сукупності за певною ознакою;

3) характеризують межі варіації ознаки.

Співвідношення між показниками варіації характеризує взаємозв’язок між показниками. 

Для вимірювання та оцінки варіації використовуються абсолютні й відносні характеристики.

Обчислення абсолютних показників варіації

Назва показників варіації

Формули показників варіації:

для незгрупованих даних

для згрупованих даних

Розмах варіації

Середнє лінійне відхилення

Середній квадрат відхилень (дисперсія)

Середнє квадратичне відхилення

Величина розмаху варіації характеризує максимальну різницю між значеннями ознаки. вона не може вимірювати закономірну силу її варіації у всій сукупності.

Усі розглянуті показники варіації – розмах варіації, середнє лінійне відхилення, середній квадрат відхилень та середнє квадратичне відхилення – завжди виражають у одиницях вихідних даних ряду та середньої величини. Всі вони є абсолютним виміром варіації. А це означає, що безпосередньо порівнювати абсолютні показники варіації у варіаційних рядах різних явищ не можна. Для того, щоб забезпечити їх порівняння, потрібно обчислити показники, які характеризують варіацію, виражену в стандартних величинах, наприклад, у відсотках. Відношення абсолютних характеристик варіації до середньої величини називаються коефіцієнтами варіації.

Відносні показники варіації

Відношення абсолютних характеристик варіації до середньої величини називаються коефіцієнтами варіації.

  •  лінійний коефіцієнт варіації

  •  квадратичний коефіцієнт варіації

  •  коефіцієнт осциляції

Коефіцієнти варіації дозволяють порівнювати варіацію різних ознак або варіацію однієї ознаки у різних сукупностях. Для порівняння варіацій найчастіше використовують квадратичний коефіцієнт варіації. Цей показник використовується для оцінки однорідності сукупності, тобто надійності і типовості середньої величини. Розрізняють такі значення відносних коливань:

V < 10%

–  незначне коливання

V = від 10% до 30%

–  середнє коливання

V > 30%

–  велике коливання

Вважають, що сукупність є однорідною, а середня – типовою, коли коефіцієнт не перевищує 33%.

Зміст і методику розрахунку показників варіації розглянемо на умовному прикладі.

Таблиця.  Дані про статутний фонд двох акціонерних компаній

АТ 1

АТ 2

Засновники

Розмір внеску кожного засновника, млн. гр. од

Засновники

Розмір внеску кожного засновника, млн. гр. од

1

8

1

9

2

6

2

10

3

11

3

8

4

13

4

11

5

9

5

9

6

7

6

7

Статутний фонд

млн. гр. од

Статутний фонд

млн. гр. од

Середній розмір внеску до статутного фонду, млн. гр. од:

 

Отже, середній середній внесок одного засновника до статутного фонду АТ однаковий, проте відхилення внеску окремих засновників від середнього показника є різним.

Розмах варіації характеризує межі, в яких змінюється значення ознаки, і обчислюється як різниця між максимальним і мінімальним значенням ознаки.

У нашому прикладі показник розмаху варіації

для першого АТ

для другого АТ  

Порівняння показників свідчить про те, що розмах варіації і, відповідно розмір коливань ознаки, більший у першому АТ, тобто показники внеску засновників до статутного фонду у другому АТ більш однорідні.

Таким чином, при однаковому значенні середньої ознаки фактично маємо дві різні за рівнем коливання статистичні сукупності. Це ще раз підтверджує, що хоч середня величина і є узагальнюючою характеристикою статистичної сукупності, проте вона не завжди відображає внутрішній зміст статистичної сукупності.

В інтервальному ряді розподілу розмах варіації визначають як різницю між верхнею межею останнього інтервалу і нижньою межею першого або як різницю між середніми значеннями цих інтервалів.

У практиці статистико-економічного аналізу широко використовують характеристики варіації, що ґрунтуються на відхиленнях індивідуальних значень ознаки від середньої величини . Оскільки   то при розрахунку такого роду характеристик використовують або модулі, або квадрати відхилень. У результаті маємо такі характеристики варіації: середнє лінійне  і середнє квадратичне  відхилення  та дисперсію .

Методика обчислення цих показників залежить від характеру вихідних даних.

Таблиця. Розрахунок показників варіації внеску засновників до статутного фонду двох АТ

Порядковий номер засновника

Статутний фонд АТ,

млн. гр. од

Відхилення

АТ 1

АТ 2

АТ 1

АТ 2

1

8

9

2

6

10

3

11

8

4

13

11

5

9

9

6

7

7

Разом

54

54

1. Середнє лінійне відхилення:

–  для першого АТ    

–  для другого АТ   

Таким чином, індивідуальні значення внеску до статутного фонду окремих засновників відрізняються від середнього внеску: у першому АТ на __ млн гр. од, а у другому АТ на  ___ млн гр. од.  Отже, за показником внеску до статутного фонду ____________________________________________________________________________.

2. Середній квадрат відхилень (дисперсія)

–  для першого АТ    

–  для другого АТ   

3. Середнє квадратичне відхилення

–  для першого АТ    

–  для другого АТ   

Середнє квадратичне відхилення є мірилом надійності середньої. Чим менше середнє квадратичне відхилення, тим об’єктивніше середня арифметична відображує всю сукупність.

Як видно з розрахованих показників, у другому АТ дисперсія і середнє квадратичне відхилення набагато менші, ніж у першому, що свідчить про високу надійність середньої у другому АТ.

Обчислимо відносні показники варіації у наведеному прикладі:

Коефіцієнти варіації

Формула

1 АТ

2 АТ

лінійний

квадратичний

осциляції

Лінійний коефіцієнт варіації або відносне лінійне відхилення характеризує частку середнього значення абсолютних відхилень від середньої величини. У першому АТ він становить ________%, а у другому – ___________%.

 Квадратичний коефіцієнт варіації у першому АТ  дорівнює ____%, що свідчить про середні коливання індивідуальних значень внеску окремого засновника відносно середнього внеску в цілому до статутного фонду, тобто сукупність засновників першого АТ якісно однорідна, і відповідно, типовість середньої величини виробітку у цьому АТ підтверджується. Аналогічно і у другому АТ: сукупність засновників  досить однорідна.

Коефіцієнт осциляції відображає відносне коливання крайніх значень ознаки навколо середньої.

За даними ряду розподілу (згруповані дані) характеристики варіації обчислюють як середні зважені. Методику обчислення показників варіації за згрупованими даними розглянемо на прикладі варіації віку матерів новонароджених у містах.

Таблиця. Розрахунок показників варіації віку матерів новонароджених у містах

Вік матерів, років

% до підсумку

Розрахункові показники

хі

хі f

|xi-|

|xi-|f

(xi-)2

(xi-)2f

До 20

14,0

20– 25

40,0

25 – 30

27,1

30 – 35

13,2

35 – 40

4,7

40і більше

1,0

Разом

100

1. Середній вік матерів новонароджених:

2. Показники варіації:

  •   розмах  варіації      

  •  середнє лінійне відхилення

  •  середній квадрат відхилень (дисперсія)

  •  середнє квадратичне відхилення

  •  лінійний коефіцієнт варіації

  •   квадратичний коефіцієнт варіації  

  •   коефіцієнт осциляції

Висновок: середній вік матерів новонароджених становить _____ років. Вік окремих матерів відрізняється від середнього віку на ________ років за середнім лінійним відхиленням і на _________ років за середнім квадратичним відхиленням. Квадратичний коефіцієнт варіації ________%, що свідчить про _____________________________ коливання віку матерів новонароджених по відношенню до середнього віку, а це означає, що сукупність матерів за віком можна вважати __________________________________________, а середній вік буде ____________________________________ для цієї сукупності.

2. Характеристики форми розподілу.

Формою розподілу статистичної сукупності прийнято називати криву співвідношення частот і значень варіюючої ознаки.

За своєю формою розподіли поділяють на такі види: одно-, дво- і багатовершинні. Наявність двох і більше вершин свідчить про неоднорідність сукупності, про поєднання в ній груп із різними рівнями ознаки. Це свідчить про необхідність перегрупування даних із метою виявлення більш однорідних груп. Розподіли якісно однорідних сукупностей, як правило, одновершинні (одномодальні). Серед одновершинних розподілів є симетричні і асиметричні (скошені), гостро- і плосковершинні.

У симетричному (нормальному) розподілі рівновіддалені від центру значення ознаки мають однакові частоти. У симетричному розподілі характеристики центру мають однакові значення .

В асиметричному розподілі вершина розподілу зміщена. Напрям асиметрії протилежний напряму зміщення вершини. Асиметрія виникає внаслідок обмеженої варіації в одному напрямі або під впливом домінуючої причини розвитку, яка призводить до зміщення центра розподілу.

У разі правосторонньої асиметрії вершина зміщена вліво і характеристики центру мають певні розбіжності: . У разі лівосторонньої асиметрії вершина зміщена вправо і характеристики центру також мають розбіжності: .

Стандартизовані відхилення

Асиметрія – це одна з властивостей форми розподілу, що пов’язана з варіацією. Міра асиметрії – відносне відхилення.

характеризують напрям і міру скошеності в середині розподілу. В симетричному розподілі А=0, при правосторонній асиметрії А>0, при лівосторонній – A<0.

Розрахунок стандартизованих відхилень середньої і медіани, середньої та моди розглянемо на прикладі:


Таблиця.  
Розподіл робітників підприємства за стажем роботи

Стаж роботи, років

Кількість робітників

f

Кумулятивна частка

S f 

Центр інтервалу

хі

xf

x2 f

До 5

17

17

4

68

272

5 – 7

39

56

6

234

1404

7 – 9

51

107

8

408

3264

9 – 11

42

149

10

420

4200

11 – 13

29

178

12

348

4176

13 – 15

15

193

14

210

2940

15 і більше

7

200

16

112

1792

Разом

200

1800

18048

1. Середній стаж роботи    

2. Медіана стажу роботи   

3. Мода стажу роботи  

4. Середнє квадратичне відхилення

5.  Стандартизовані відхилення   та ,

Обчислені показники свідчать про ________________________________ асиметрію розподілу.

Алгебраїчно центральний момент розподілу – це середня арифметична k-го ступеня відхилення індивідуальних значень ознаки від середньої:

Моменти 3-го і 4-го порядку характеризують асиметрію та ексцес.

Асиметрія та ексцес – це дві пов’язані з варіацією властивості форми розподілу.

Момент 3-го порядку характеризує асиметрію. У симетричному розподілі μ3 = 0. Чим більша скошеність ряду, тим більше значення μ3.

Для порівняння ступеня асиметрії різних розподілів використовується стандартизований момент 3-го порядку.

При правосторонній асиметрії коефіцієнт AS>0, при лівосторонній AS<0. Звідси правостороння асиметрія називається додатною, а лівостороння – від’ємною.

Вважається, що при AS<0,25 асиметрія низька, якщо AS  не перевищує 0,5  – середня, при AS >0,5 – висока.

Ексцес розподілу – це ступінь зосередженості елементів сукупності навколо центру розподілу.

Для вимірювання ексцесу використовується стандартизований момент 4-го порядку

У симетричному, близькому до нормального, розподілі Ek=3. Очевидно, при гостровершинному розподілі Ek>3, при плосковершинному  Ek <3.

Порядок обчислення коефіцієнтів асиметрії і ексцесу розглянемо на прикладі

Таблиця.  Розрахунок коефіцієнтів асиметрії та ексцесу

Термін експлуатації, років

Кількість автомоб

до 4

25

4-8

40

8-12

20

12 і більше

15

Разом

100

Отже, розподіл _____________________________________________ характеризується ___________________________________ асиметрією. Коефіцієнт ексцесу _________________ (Еk = ______________), що свідчить про _________________________________розподілу.

Задача 1. Дані про середню температуру повітря за місяцями у деяких містах України (градусів Цельсія):

Місяці

Запоріжжя

Львів

Черкаси

Київ

Січень

-4,2

-4,6

-5,9

-5,6

Лютий

-2,9

-3,1

-4,6

-4,2

Березень

1,7

-1,1

0,4

0,7

Квітень

9,9

7,7

8,7

8,7

Травень

16,4

13,2

15,3

15,2

Червень

20,2

16,1

18,4

15,2

Липень

22,0

17,3

19,8

19,3

Серпень

21,2

16,8

19,1

18,6

Вересень

16,2

13,0

14,2

13,9

Жовтень

9,5

8,0

7,8

8,1

Листопад

3,8

2,5

2,1

2,1

Грудень

-0,8

-2,1

-2,5

-2,3

За даними кожного міста обчислити: 1) середню температуру повітря; 2) розмах варіації; 3) коефіцієнт осциляції; 4) середнє лінійне відхилення; 5) відносне лінійне відхилення. Пояснити отримані результати. У якому місті варіація температури найбільша?

Задача 2. Статистичні характеристики розподілу сільськогосподарських підприємств за рівнем ефективності виробництва становили:

Показник ефективності

Середній рівень

Мода

Середнє квадратичне відхилення

Вихід продукції на 100 га сільськогосподарських угідь, гр.од.

256

240

85

Продуктивність праці, гр.од. на 1 людино-годину

112

100

39

Фондовіддача, гр.од.

0,9

1,0

0,4

Рентабельність виробництва, %

9,6

12,4

7,4

Порівняйте варіацію та асиметрію розподілу сільськогосподарських підприємств за наведеними показниками ефективності виробництва.

Задача 3. Використовуючи характеристики центру розподілу, зробити висновки відносно наявності, напряму і ступеня асиметрії розподілу робітників за стажем роботи:

Стаж роботи, років

До 5

5–10

10–15

15–20

20 і більше

Разом

Кількість робітників,  % до підсумку

33,0

29,0

24,0

9,0

5,0

100


Тема 8. СТАТИСТИЧНІ МЕТОДИ ВИМІРЮВАННЯ ВЗАЄМОЗВ’ЯЗКІВ.

План лекції

  1.  Види взаємозв’язків між явищами.
  2.  Метод  аналітичного групування.
  3.  Дисперсійний аналіз.
  4.  Основи кореляційно-регресійного аналізу..

1. Види взаємозв’язків між явищами.

Зв’язки мiж явищами, окремими їх ознаками досить рiзноманiтнi, однак у будь-якому випадку одні ознаки виступають як фактори, що впливають на інші і зумовлюють їх зміну, інші – як результати дії цих факторів. Одні із них є причиною, інші наслідком.

Якщо перші прийнято називати ознаками-факторами, або факторними (причинними) ознаками, то другі – результативними (наслідковими) ознаками.

Різноманітність зв’язків, в яких перебувають явища, зумовлює необхідність їх класифікації, зведення зв’язків до певних типів, форм за їх істотними рисами i властивостями. В основу класифікації зв’язків у статистиці покладено відмінність і подібність зв’язків за такими їх особливостями, як ступінь тісноти, спрямованість, аналітичне вираження, одиничність або множинність факторів. Відповідно до цього розрізняють зв’язки функціональні і кореляційні, прямі і обернені, прямолінійні і криволінійні, однофакторні і багатофакторні.

1) за характером дії:

  •  функціональні зв’язки – це зв’язки, за яких кожному можливому значенню факторної ознаки х відповідає чітко визначене значення результативної ознаки – у, тобто функціональні зв’язки характеризуються повною відповідністю між причиною i наслідком, факторною i результативною ознаками.
  •  стохастичні зв’язки виявляються зміною умовних розподілів. Тобто за цього зв’язку у ланці зв’язку “х у” кожному значенню ознаки х відповідає певна множина значень ознаки у, які варіюють і утворюють так званий умовний розподіл.
  •  кореляційні зв’язки – це різновид стохастичних зв’язків, коли зі зміною факторної ознаки х змінюються групові середні результативної ознаки у. Тобто умовні розподіли замінюються одним параметром – середньою.

Таблиця 1. Види взаємозв’язків

Факторна

ознака,  Хі

Результативна ознака  у  при наявності зв’язку:

функціонального

стохастичного

кореляційного

Х1

У1

У1  У2

Х2

У2

У1  У2 У3

...

...

...

Хп

У п

Уп-1  Уп

2) за напрямком дії

Прямий зв’язок – це такий зв’язок, при якому зі збільшенням або зменшенням значень факторної ознаки відповідно збільшується або зменшується значення результативної ознаки, тобто факторна i результативна ознаки змінюються в одному напрямку.

Обернений зв’язок називають такий зв’язок, при якому значення результативної ознаки змінюється у протилежному напрямку відносно зміни значення факторної ознаки.

3) за формою аналітичного вираження

Прямолінійні зв’язки – це зв’язки, за яких залежність результативної ознаки від певної ознаки-фактора може бути виражена рівнянням прямої лінії.

Криволінійні зв’язки – це зв’язки, за яких залежність результативної ознаки від певної ознаки-фактора може бути виражена рівнянням якої-небудь кривої (гіперболи, параболи та ін.)

Аналітичним рівнянням можна описувати лише функціональні зв’язки. Кореляційні зв’язки описуються рівнянням лише наближено.

4) за кількістю ознак-факторів

Однофакторний зв’язок – це зв’язок, за якого досліджується залежність результативної ознаки тільки від однієї ознаки-фактора.

Багатофакторний зв’язок – це зв’язок, за якого досліджується кореляційна залежність результативної ознаки одночасно від декількох ознак-факторів.

Для відповіді на питання про наявність або відсутність кореляційного зв’язку використовують ряд специфічних методів:

  •  елементарні прийоми (паралельне порівняння рядів значень факторної і результативної  ознак, балансовий метод, графічне зображення, метод аналітичного групування);
  •  дисперсійний аналіз;
  •  кореляційно-регресійний аналіз.

Для вивчення функціональних зв’язків використовують такі методи:

  •  індексний метод;
  •  балансовий метод;
  •  графічний метод. 

Для вивчення стохастичних зв’язків використовуються такі методи:

  •  метод порівняння паралельних рядів;
  •  метод аналітичних групувань;
  •  дисперсійний аналіз;
  •  кореляційний аналіз.

2.  Метод аналітичного групування.

Найбільш поширеним і простим методом дослідження взаємозв’язків у статистиці є метод аналітичного групування і побудова кореляційних таблиць.

Метод аналітичного групування полягає у тому, що всі елементи сукупності групують, як правило, за факторною ознакою х i в кожній групі обчислюють середні значення результативної ознаки у, тобто лінія регресії оцінюється лише в окремих точках, які відповідають певному значенню х.

Наприклад, розглянемо дані про обіг коштів і прибуток десяти банків.

Таблиця 2.  Показники діяльності банків у звітному періоді

№ банку

Обіг коштів, млн.грн.

Прибуток, млн.грн.

1

7

3

2

11

4

3

12

4

4

16

6

5

22

8

6

27

7

7

30

11

8

38

14

9

45

18

10

46

17

Проведемо комбіноване групування банків за двома ознаками: за обігом коштів і розміром одержаного прибутку, утворивши по три групи з рівними інтервалами (табл. 3.):

Таблиця 3. Розподіл банків за обігом коштів та розміром прибутку

Групи банків за обігом коштів, млн.грн.

Кількість банків за розміром прибутку, млн.грн.

Разом

3 – 8

8 – 13

13 – 18

7 – 20

20 – 33

33 – 46

Разом

.

Побудовану за результатами аналітичного групування таблицю називають кореляційною таблицею. Якщо частоти у кореляційній таблиці розташовані по діагоналі з лівого верхнього кута у правий нижній кут, тобто більшим значенням фактора відповідають більші значення функції, то передбачається наявність прямого кореляційного зв’язку між ознаками. Якщо ж частоти розташовані по діагоналі з правого кута у лівий, то передбачають наявність оберненого зв’язку між ознаками.

На другому етапі проводиться оцінка лінії регресії – у кожній групі за факторною ознакою обчислюють середні значення результативної та факторної ознак. Групові середні обчислюють за вихідними незгрупованими даними.

         та          

У нашому прикладі :

Середній прибуток, млн.грн.

Середній обіг коштів, млн.грн.

Результати розрахунків оформляємо у вигляді таблиці 4.

Таблиця 4.  Залежність прибутку від обігу коштів банків

з/п

Групи банків за обігом коштів, млн.грн.

Кількість банків

f

Середній прибуток, млн.грн.

Середній обіг коштів, млн.грн.

1

7 – 20

2

20 – 33

3

33 – 46

Разом

Зростання групових середніх рівня прибутку від групи до групи  свідчить про наявність кореляційного зв’язку між обігом коштів і розміром прибутку.

Крім того аналітичне групування дає змогу встановити кількісні співвідношення між ознаками, що вивчаються. Можна не лише стверджувати, що існує кореляційний зв’язок між факторною  х і результативною у ознаками, а й визначити, як у середньому змінюється у зі зміною х на одиницю. Ефекти впливу х на у визначаються відношенням приростів середніх групових  у  :  х .

                  і т.д.

Обчислимо ефект впливу розміру обігу коштів на рівень прибутку банків за даними таблиці 4:

Отже, з підвищенням обігу коштів на 1 млн.грн. прибуток збільшується: в другій групі порівняно з першою на _________ млн.грн., в третій групі порівняно з другою на ____________ млн.грн.

Третій етап аналітичного групування – вимірювання тісноти зв’язку за допомогою дисперсійного аналізу.

3. Дисперсійний аналіз

Основною метою дисперсійного аналізу є виявлення впливу окремих факторів чи умов, які визначають варіацію ознаки. В основі дисперсійного аналізу закон розкладання загальної дисперсії на складові, згідно якого загальна дисперсія результативної ознаки у складається із двох частин: міжгрупової (факторної) дисперсії та середньої з групових (залишкової).

Взаємозв’язок факторної та залишкової варіації описується правилом розкладання дисперсії:

Загальна дисперсія характеризує варіацію результативної ознаки під впливом всіх факторів і причин, як систематично діючих, так і випадкових. Загальна дисперсія результативної ознаки обчислюється за індивідуальними значеннями ознаки у.

Міжгрупова дисперсія характеризує варіацію групових середніх, тобто варіацію результативної ознаки, яка пов’язана з варіацією групувальної факторної ознаки.

Середня з групових дисперсій характеризує  варіацію  результативної ознаки, пов’язану з варіацією всіх факторних ознак, крім тієї, яка покладена в основу групування.

          або            

Вище було розглянуто приклади розрахунку показників варіації для кількісних ознак. Однак поряд з варіацією кількісних ознак може ставитися задача оцінювання варіації якісних ознак. Якщо є два взаємовиключних варіанти значень ознаки, це означає наявність альтернативної мінливості ознак.

Альтернативним ознакам присвоюють два кількісних значення (варіанта):

1 – мають цікаву для нас ознаку;

0 – не мають цікаву для нас ознаку.

У якості ваг присвоюються:

р – частка одиниць (частість варіанта), які мають певну ознаку;

q – частка одиниць (частість варіанта), які не мають певну ознаку:

p+q=1, q=1р

Наприклад. На 10000 людей населення району припадає 4500 чоловіків і 5500 жінок. Обчислити дисперсію.

Таблиця. Розрахунок загальної дисперсії за індивідуальними даними

№ банку

Прибуток, млн.грн.

уі

1

3

9

2

4

16

3

4

16

4

6

36

5

8

64

6

7

49

7

11

121

8

14

196

9

18

324

10

17

289

Разом

92

1120

Загальна дисперсія :

Таблиця. Розрахунок міжгрупової дисперсії за результатами аналітичного групування

з/п

Групи банків за обігом коштів, млн.грн.

Кількість банків

f

Середній прибуток, млн.грн.

1

7 – 20

2

20 – 33

3

33 – 46

Разом

Міжгрупова дисперсія:

Середня з групових дисперсій :

 

Суть дисперсійного аналізу полягає у зіставленні (порівнянні) різних видів дисперсій: міжгрупової та загальної, загальної та внутрішньогрупової, міжгрупової та внутрішньогрупової. У нашому прикладі вплив розміру обігу коштів банків як групуючого фактора на розмір прибутку майже у ______разів (__________________________________) більший, ніж вплив інших випадкових факторів. Міжгрупова варіація становить _____ % у загальній варіації (__________________________________________________________).

Для вимірювання тісноти (щільності) зв’язків між ознаками застосовується  кореляційний метод, суть якого полягає у визначенні спеціальних співвідношень, що базуються на правилі додавання дисперсій.

Відношення міжгрупової (факторної) дисперсії до загальної розглядається як міра щільності кореляційного зв’язку і називається коефіцієнтом  детермінації.

За статистичною структурою дане відношення характеризує частку варіації результативної ознаки у, яка пов’язана з варіацією ознаки х у групі. Здобувши квадратний корінь із цього відношення, одержуємо емпіричне кореляційне відношення.

Кореляційне відношення змінюється від 0 до 1. Якщо , міжгрупова дисперсія дорівнює нулю. Це можливо лише за умови, коли всі групові середні однакові і кореляційний зв’язок між ознаками відсутній. При  міжгрупова дисперсія дорівнює загальній, а середня з групових – нулю. В цьому випадку кожному значенню факторної ознаки відповідає єдине значення результативної ознаки, тобто зв’язок між ознаками функціональний.

Сила зв’язку залежно від значення емпіричного кореляційного співвідношення η (співвідношення Чеддока):

0,1–0,3 слабка

0,3–0,5 помірна

0,5–0,7 помітна

0,7–0,9 щільна

0,9–0,99 надто щільна

У нашому прикладі:

Таким чином, в обстеженій сукупності банків _________% варіації прибутку пов’язані з варіацією обігу коштів.

Індекс кореляції визначають зіставленням внутрішньогрупової і загальної дисперсії, і обчислюють за формулою:

,

Чим  ближче R до 1, тим тісніший зв’язок між ознаками.

Чим  ближче R до 1, тим тісніший зв’язок між ознаками.

Слід  підкреслити, що значення 0  не завжди є доказом наявності кореляційного зв’язку між ознаками. Відмінне від нуля кореляційне відношення може з’явитись і при випадковому розподілі сукупності на групи.

Перевірка істотності відхилень групових середніх здійснюється за допомогою критеріїв математичної статистики. Вона ґрунтується на порівнянні фактичного значення  з так званим критичним. Останнє є тим максимально можливим значенням кореляційного відношення, яке може виникнути випадково при відсутності кореляційного зв’язку. Якщо фактичне значення більше від критичного, то зв’язок між результативною і факторною ознаками вважається істотним. Якщо фактичне значення менше критичного, то наявність кореляційного зв’язку між ознаками не доказана і зв’язок вважається неістотним.

Для оцінки надійності кореляційних характеристик використовують F-критерій Фішера  або t-критерій Стьюдента.

Критерій Фішера (F-критерій) визначається за формулою:

де  – міжгрупова дисперсія;  – середня з групових (залишкова) дисперсія; k1  i  k2   – ступені вільності для великої і малої дисперсій.

Фішер знайшов розподіл відношень дисперсій і розробив відповідні математичні таблиці, в яких наводиться теоретичний F-критерій (Fт) при двох ймовірностях 0,95 і 0,99. Якщо Fф  > Fт , то з прийнятим ступенем ймовірності можна стверджувати про наявність впливу фактору, який вивчається. Коли ж Fф  Fт, то різниця між дисперсіями зумовлена впливом випадкових факторів.

Розподіл у таблицях Фішера для знаходження Fт залежить від ступенів вільності міжгрупової k1  і середньої з групових k2  дисперсій. В аналітичному групуванні їх обчислюють за формулами:

          

де nкількість елементів досліджуваної сукупності; mчисло груп.

За даними наведеного вище прикладу (табл. 6):

Знаходимо Fт при ймовірності 0,95 і даних супенях вільності за математичною таблицею. Воно становить Fт (0,95) = 4,8.

Отже, Fф  >  Fт (33,935 >  4,8), що свідчить про суттєвий вплив обігу коштів банків на їх прибуток.

Надійність кореляційного відношення за критерієм Стьюдента (t – критерій) визначається за формулою:

де   –  середня похибка кореляційного відношення

Якщо критерій Стьюдента , показник кореляційного відношення вважають вірогідним (тобто зв’язок між досліджуваними явищами є доведеним). Якщо ж критерій , то висновки про вірогідність зв’язку між досліджуваними явищами сумнівні.

4. Основи кореляційно-регресійного аналізу

У кореляційно-регресійному аналізі оцінка лінії регресії здійснюється не в окремих точках, як в аналітичному групуванні, а в кожній точці інтервалу зміни факторної ознаки  х. Тобто лінія регресії у даному випадку безперервна і зображується у вигляді певної функції Y = f (x), яка називається рівнянням регресії, а Y  – це теоретичні значення результативної ознаки.

Різні явища по-різному реагують на зміну факторів. Для того, щоб відобразити характерні особливості зв’язку конкретних явищ, статистика використовує різні за функціональним видом регресійні рівняння. Якщо зі зміною фактора  х результат  у змінюється більш-менш рівномірно, такий зв’язок описується лінійною функцією Y = a + bx. При нерівномірному співвідношенні варіацій взаємозв’язаних ознак (наприклад, коли прирости значень у зі зміною  х  прискорені чи сповільнені або напрям зв’язку змінюється), використовують нелінійні регресії, зокрема: степеневу:   Y = axb; гіперболу:   Y = a + ; параболу:    Y = a + bx + cx2

Y = a + bx.

Параметр b (коефіцієнт регресії) – величина іменована, має розмірність результативної ознаки і розглядається як ефект впливу х  на  у . Параметр а  – вільний член рівняння регресії, це значення  у при х = 0. Якщо межі варіації  х  не містять нуля, то цей параметр має лише розрахункове значення.

Параметри рівняння регресії визначаються методом найменших квадратів, основна умова якого – мінімізація суми квадратів відхилень емпіричних значень  у  від  теоретичних  Y:          

Математично доведено, що значення параметрів а та b, при яких мінімізується сума квадратів відхилень, визначається із системи нормальних рівнянь.

Розглянемо порядок обчислення параметрів лінійної регресії за даними про вартість основних виробничих фондів та обсяг валової продукції на 10 підприємствах галузі (табл.7).

Таблиця 7. Показники діяльності підприємств

Номер підприємства

Вартість основних виробничих фондів, млн.грн.

Випуск валової  продукції, млн.грн.

1

3

20

2

3

25

3

5

20

4

6

30

5

7

32

6

6

25

7

8

29

8

9

37

9

10

40

10

9

36

Передбачаючи лінійний зв’язок між вартістю основних виробничих фондів та випуском продукції, виражаємо залежність між цими показниками рівнянням прямої  і визначаємо його параметри методом найменших квадратів із системи нормальних рівнянь:

Розрахунки наведених в системі рівнянь сум виконаємо в табличній формі (табл. 8):


Таблиця  8.
Розрахункові показники для складання системи нормальних рівнянь

підприємства

Вартість основних виробничих фондів, млн.грн.

х

Випуск валової продукції, млн.грн.

у

ху

х2

у 2

Yх

1

3

20

2

3

25

3

5

20

4

6

30

5

7

32

6

6

25

7

8

29

8

9

37

9

10

40

10

9

36

Разом

66

294

Підставимо в систему нормальних рівнянь фактичні дані із таблиці:

294 = 10 а + 66 b

2078 = 66 а + 490 b

Рівняння кореляційного зв’язку буде мати вигляд

тобто кожен млн.грн. основних виробничих фондів дає приріст валової продукції в середньому на _________________ млн.грн.

Параметр  b  може набувати від’ємного значення, що свідчить про наявність оберненого зв’язку між показниками.  

Після визначення параметрів рівняння регресії розраховуємо теоретичну лінію регресії шляхом підстановки в рівняння кореляційного зв’язку

і т.д.

Якщо параметри рівняння зв’язку визначені правильно, то .

Поряд із визначенням характеру зв’язку та ефектів впливу факторів х  на результат у важливе значення має оцінка щільності зв’язку, тобто оцінка узгодженості варіації взаємопов’язаних ознак.

Для оцінки щільності зв’язку зазначених параметрів (ознак) обчислимо кореляційне відношення та здійснимо додаткові розрахунки (табл. 9)

Таблиця 9. Зв’язок між вартістю основних виробничих фондів і випуском продукції

підприємства

Випуск

валової продукції, млн.грн

у

Yх

1

20

2

25

3

20

4

30

5

32

6

25

7

29

8

37

9

40

10

36

Разом

294

Визначимо середній випуск продукції на одне підприємство:

Кореляційне відношення за даними розрахункових даних, наведених в таблиці 9, обчислимо за формулою :

Для вимірювання щільності прямолінійних зв’язків використовується лінійний коефіцієнт кореляції. Найбільш зручною формулою для розрахунку коефіцієнта кореляції за незгрупованими даними є наступна:

У нашому прикладі (табл.8):

Коефіцієнт кореляції можна обчислювати і за іншими формулами. Зокрема:

Якщо визначена форма кореляційного зв’язку і обчислений коефіцієнт регресії а , то коефіцієнт кореляції можна обчислити за формулою:

Лінійний коефіцієнт кореляції може набувати любих значень в межах від –1 до +1. Якщо  r  близьке до 1, то зв’язок  між  ознаками тісний, якщо  r  наближається до 0, то зв’язок незначний. Знак лінійного коефіцієнта кореляції вказує напрямок зв’язку – знак плюс свідчить про прямий зв’язок, знак  мінус –  обернений зв’язок.

В нашому прикладі лінійний коефіцієнт кореляції свідчить про ________________ зв’язок між показниками – обсяг випуску продукції на __________% залежить від вартості основних виробничих фондів і на _____% – від інших факторів.

Перевірку істотності зв’язку в кореляційно-регресійному аналізі здійснюють за допомогою тих самих критеріїв і за тими ж процедурами, що і в аналітичному групуванні та дисперсійному аналізі.

Для встановлення достовірності обчисленого кореляційного відношення скористаємося  t – критерієм Стьюдента:

Оскільки

залежність випуску продукції від вартості основних виробничих фондів є доведеною.

Задача 1. . Є такі вибіркові дані про заощадження населення району:

Групи населення

Кількість вкладів, тис. од.

Середній розмір вкладу, тис. грн

Коефіцієнт варіації вкладу, %

1. Населення міста

7

4

20

2. Населення села

3

6

30

Визначити щільність зв'язку між середнім розміром вкладу та типом населення за допомогою емпіричного кореляційного відношення. Зробити висновки.

Задача 2. За даними обстеження комерційних банків міста, 80 % загальної кількості клієнтів банку – це юридичні особи, середній розмір кредиту в яких становить 110 тис. грн та коефіцієнт варіації 26 %, а 20% - фізичні особи із середнім розміром позики 18 тис. грн за середнього квадратичного відхилення 6 тис грн. Використовуючи правило складання дисперсій, визначити щільність зв'язку між розміром позики і типом клієнта, тобто емпіричне кореляційне відношення. Зробити висновки.

Задача 3. В результаті одноразового спостереження тривалості телефонних розмов на різних рівнях зв'язку одержані дані:

Рівень зв'язку

Кількість переговорів

Середня тривалість телефонної розмови, хв

Групова дисперсія тривалості розмов

Внутрішньообласний

500