15716

ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН

Лекция

Математика и математический анализ

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ СПОСТЕРЕЖЕНЬ Модуль 2: ОСНОВНІ ХАРАКТЕРИСТИКИ ОБРОБЛЕННЯ ДАНИХ Лекція 10. ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН План лекції 7: 10.1. Щільність ймовірності випадкових величин 10.2. Числові характеристики випадкови

Украинкский

2013-06-15

1.22 MB

5 чел.

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ

СПОСТЕРЕЖЕНЬ

Модуль 2: ОСНОВНІ ХАРАКТЕРИСТИКИ ОБРОБЛЕННЯ ДАНИХ

Лекція 10. ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН

План лекції 7:

10.1. Щільність ймовірності випадкових величин

10.2. Числові характеристики випадкових величин

10.3. Гістограми розподілу випадкових величин

10.1. Щільність ймовірності випадкових величин

Випадковою величиною називається змінна, яка приймає своє чисельне (рос. численное) значення залежно від результату випадкового експерименту. Якщо результатом випробування є вимірювання фізичної величини, то її вважа-ють випадковою величиною, а виміряне значення є її чисельним значенням.

Випадкова величина х може бути дискретною або неперервною. Наприклад, випадкова величина, пов’язана з підкиданням гральної кості, вважається дискретною з результатом у вигляді цілих чисел від 1 до 6, тоді як проміжки часу між надходженням замовлень в систему обслуговування вважаються неперервною випадковою величиною з додатними значеннями.

Як неперервна, так і дискретна випадкова величина має щільність розподілу ймовірностей, яку часто називають просто щільність ймовірності і позначають як f(x) (для неперервної випадкової величини) або р(х) (для дискретної випадкової величини). Щільності ймовірностей повинні задовольняти умовам  невід’ємності:

р(х) ≥ 0 (для дискретної випадкової величини),

f(x) ≥ 0 (для неперервної випадкової величини)

та умовам нормування:

для дискретної випадкової величини,

для неперервної випадкової величини.

Умова невід’ємності для неперервних та дискретних розподілень означає, що щільність ймовірності не може приймати від’ємні значення (у протилежному випадку ймовірність деяких подій могла б бути від’ємною). Умова нормування свідчить про те, що сума ймовірностей по усьому простору подій повинна дорівнювати одиниці.

Найважливішею імовірнісною характеристикою випадкової величини є функція розподілення, яка визначається таким чином:

Р{xX} =  для дискретної випадкової величини,

Р{xX} = для неперервної випадкової величини.

Приклад 1. Розглянемо випадок з підкиданням гральної кості. Результат гри може приймати шість різних значень x = {1, 2, 3, 4, 5, 6}, де х – випадкова величина, що приймає шість різних цілих значень з однаковими ймовірно-стями, котрі дорівнюють 1/6. Цю випадкову величину x подамо таблицею 1:

Таблиця 1 –  Вихідні дані для побудови закону розподілу

Х

1

2

3

4

5

6

р(х)

1/6

1/6

1/6

1/6

1/6

1/6

Така таблиця називається законом розподілення ймовірностей дискрет-ної випадкової величини, котрий надає повну інформацію про цю величину. У верхньому рядку зазначено усі можливі чисельні значення, а у нижній – відповідні їм ймовірності.

Щільність ймовірності і функція розподілу ймовірності випадкової величини х визначаються відповідно таким чином:

, х = 1, 2, 3, 4, 5, 6 щільність ймовірності,

, Х = 1, 2, 3, 4, 5, 6.

Графіки цих двох функцій приведені на рис. 1. Щільність ймовірності р(х) являє собою рівномірну дискретну функцію, оскільки будь-які значення випадкової величини сприймаються з однаковими ймовірностями.

Дискретний розподіл може мати безкінечну кількість можливих значень, проте ця множина значень повинна бути зчисленною. В силу умови нормування значення ймовірностей у цьому випадку повинні становитися безкінечно малими.

Рис. 1. Дискретний рівномірний закон розподілу  

Неперервною випадковою величиною називається величина, котра може приймати будь-яке значення із заданого скінченого числового іинтервалу. Інакше кажучи, неперервна випадкова величина завжди приймає незчислену множину значень, а ймовірність того, що вона прийме у точності будь-яке задане значення, дорівнює нулю.

Тому для неперервної випадкової величини має сенс говорити тільки про ймовірність попасти в деякий числовий інтервал. Якщо взяти безкінечно малий інтервал від х до х + dx, то й імовірність dp попасти в нього буде безкінечно малою, а тому її можна вважати пропорційною dx, тобто

dp = p(x<X<dx) = f(x)dx,

де коефіцієнт пропорційності f(x) залежить від х і являє собою щільність ймовірності (або щільність розподілу).

Ймовірність випадкової величини Х попасти в скінчений інтервал (х1, х2) дорівнює

P(xl<X<x2) =.

Умова нормування неперервної випадкової величини має такий вигляд

= 1.

Функція щільності ймовірності не може бути відємною. Для виконання умови нормування вона повинна зникати на нескінченості.

В якості первісної функції F(x) для f(x) беруть функцію

F(x) =,

яка монотоно зростає від 0 до 1 і має простий імовірнісний сенс F(x)=Р(- <X< х). Таку функцію называють функцією розподілу неперервної випадкової величини.

Таким чином, для задання дискретної випадкової величини слід задати закон розподілення у вигдяді таблиці, а для задання неперервної випадкової величини слід задати щільність ймовірності f(х) або функцію розподілу F(x).

Приклад 2. Припустимо, що рівномірна щільність ймовірності f(x) неперервної випадкової величини х визначається співвідношенням:

, 0 ≤ х ≤ πl.

Тоді функція розподілу F(X) випадкової величини х обчислюється за формулою:

F(X) = Р{ xX } = , 0 ≤ Х ≤ πl.

Графіки щільності ймовірності f(x) та функції розподілення F(X) представлені на рис. 2.

Рис. 2. Щільність ймовірності  f(x) і функція розподілення F(x)

10.2. Числові характеристики випадкових величин

Для загальної характеристики властивостей одновимірної випадкової величини х використовуються дві числові характеристики: математичне сподівання (середнє значення) М{x} і дисперсія D{x}. Математичне сподівання визначає характеристику положення розподілу випадкової величини х на числовій осі відносно початку координат, а дисперсія є мірою її розкиду відносно математичного сподівання М{x}. Велике значення дисперсії свідчить про високий ступінь невизначеності в описанні випадкової змінної.

При заданій щільності ймовірності (р(х) або f(x) для дискретної або неперервної випадкової величини відповідно) величина математичного сподівання М{x} обчислюється за формулами:

М{x} =  для дискретної випадкової величини,

М{x} = для неперервної випадкової величини.

Дисперсія випадкової величини D{x} характеризує ступінь розсіювання довкола М{x} і дорівнює математичному сподіванню квадрата відхилення від М{x}, тобто

D{x} =М[(xМ{x})2]

або

D{x} = для дискретної випадкової величини,

D{x} = для неперервної випадкової величини.

Обґрунтованість висновку зазначених формул легше проглядається для дискретного розподілу. В цьому випадку М{x} представляє собою зважену суму дискретних значень х, D{x} – взважену суму квадратів відхилень випадкової величини х від М{x}. Випадок з неперервно розподіленою випадковою величиною можна інтерпретувати аналогічно, замінивши операцію інтегрування операцією підсумовуванням.

Дисперсія має вимірність квадрата вимірності випадкової величини. Тому вводять поняття середнього квадратичного відхилення σ(х) випадкової величини, яке дорівнює кореню квадратичному від дисперсії:

σ(х) = .

Крім математичного сподівання і середнього квадратичного відхилення, використовують й інші числові характеристики випадкових величин. Модою розподілення Мо(х) називають таке значення дискретної випадкової величины, для якої ймовірність максимальна. Для неперервної випадкової величини модою називають те значения х, для якого функція щільності ймовірності має максимум. Якщо мода одна, то розподілення  називається унімодальним, якщо декілька — мультимодальним.

Для неперервних розподілень використовують так звані квантилі, котрі представляють собою ті значення випадкової величини, які відділяють інтервали однакової ймовірності. Серед квантилів виокремлюють медіану 0,5х; квартилі  0,25x; 0,5х; 0,75х; децилі  0,1х; 0,2х; 0,4х; процентилі  0,01х, 0,02х, …, 0,99х. Очевидно, що

Р(Х < 0,05х) = Р(Х > 0,5х)  =  0,5  –  медіана,

Р(Х < 0,25х) = Р(Х> 0,75х) = 0,25  –  квартиль.

Для характеристики асиметрії (бокової скривленості) розподілу використо-вується коефіцієнт асиметрії

С3 = М(хМ(х))33(х).

Для характеристики вертикальної приплюснутості розподілу викорис-товується ексцес

Е = [М(хМ(х))4/σ 4(х)]3,

котрий показує відхилення існуючого розподілу від нормального, для якого функцією щільності ймовірності послуговує функция Гаусса.

Використовуються також такі числові характеристики випадкових величин, як коефіцієнт варіації  σ/М(х) та розмах мах Хmin).

Приклад 1. Знайти середнє арифметичне чисел х1, х2,   , хn для даних, приведених в таблиці 1

Таблиця 1

І

1

2

3

4

5

6

7

8

9

10

хі

25

30

22

22

54

36

41

47

25

40

за формулою

= (х1 + х2 + х3 + х4 + х5 + х6 + х7 + х8 + х9 + х10)/10 =

= (25 + 30 + 22 + 22 + 54 + 36 + 41 + 47 + 25 + 40)/10 = 34.

Знайти дисперсію чисел х1, х2,   , хn для даних таблиці 2 за формулою

Таблиця 2

і

1

2

3

4

5

6

7

8

9

10

Σ

хі

25

30

22

22

54

36

41

45

25

40

340

хі-

-9

-4

-12

-12

20

2

7

11

-9

6

0

(хі-)2

81

16

144

144

400

4

49

121

81

36

1076

D = [(х1  )2 + (х2  )2 + … + 10  )2]/10 =

= [(25  34)2 + (30  34)2 + … + (40  34)2]/10 = 107,6.

Вичислити середнє квадратичне відхилення величин х1, х2, … , х10 від їх середнього значення за формулою

Дисперсію можна тлумачити як середню арифметичну квадратів різниць (х1  ), (х2  ), … (хn  ).

10.3. Гістограми розподілу випадкових величин

Вимірюючи деяку величину багато разів, ми отримуємо кожен відлік у вигляді певного дискретного значення. Ці значення можуть збігатися, можуть знаходитися близько одне до одного або далеко. Побачити, як часто ми одержували те або інше значення, зовсім не важко. Для цього достатньо побудувати гістограму, яка графічно відображає густоту розподілу ймовірностей випадкової величини.

Приклад 1. На кораблях типу «Фізик Вавілов» вал прокладається на підшипниках кочення діаметром 700 мм. Перед навішуванням на судовий вал у підшипників перевіряється зазор прибором з ціною розподілу 00,1. Результати вимірювання представлені в таблиці 1 як відхилення від номінального значення діаметра в міліметрах.

З 35 виконаних вимірів відкинуто три виміри 0,11; 0,12; 0,13 як помилкові. До розрахунку було подано 32 виміри. На основі найбільшого (Хмах = 0,10) і найменшого значення (Хmin = 0,03) підраховано ширину розподілу або поле розсіювання: ΔХ = Хмах – Хmin = 0,10 – 0,03 = 0,07.

Таблиця 1 – Результати вимірювання спостережень

0,07

0,05

0,05

0,06

0,06

0,08

0,08

0,03

0,07

0,06

0,08

0,06

0,06

0,07

0,05

0,03

0,07

0,07

0,08

0,07

0,10

0,08

0,08

0,06

0,05

0,04

0,07

0,10

0,06

0,07

0,04

0,07

0,11

0,12

0,13

Якщо кількість спостережень у виборці понад 20, то для систематизації та упорядкування вибірки весь діапазон значень розбивається на інтервали. Кількість інтервалів визначається за формулою:

k = 1 + 3,2lgn.

При виборі числа інтервалів кількість їх повинна бути не менше 67 при п = 30 .. 100 i не менше 915 при п > 100. Покладемо, що число інтервалів дорівнює к = 7. Тоді ціна інтервалу дорівнюватиме

Δх = ΔХ / k = 0,07 / 7 = 0,01.

Кількість значень ni, які потрапили в один із інтервалів, визначають частоту потрапляння в інтервал.

Упорядкований ряд середніх значень хi інтервалів зі зростанням називається статистичним рядом.

Графічне зображення статистичного ряду, координатами якого є частота інтервалу (вертикальна вісь y) і довжина інтервалу (горизонтальна вісь х), називається гістограмою.

Для побудови гістограми спочатку слід підрахувати частоти емпіричного розподілу за допомогою таблиці 2.

Таблица2 – Частоти емпіричного розподілу

Інтервали

Підрахунок частот позначками

Частота

Від

до

0,03

0,04

ІІ

2

0,04

0,05

ІІ

2

0,05

0,06

ІІІІ

4

0,06

0,07

ІІІІІІІ

7

0,07

0,08

ІІІІІІІІІ

9

0,08

0,09

ІІІІІІ

6

0,09

0,03

ІІ

2

Ліворуч вписуються інтервали від Хmin до (Хmin + с), від (Xmin + с) до (Хmin + 2с) i т.д. У кожен інтервал включаються розміри, що лежать у межах від найменшого значення інтервалу включно до найбільшого значення інтервалу, кpiм його. Праворуч за допомогою позначок роблять підрахунок числа спостережених poзмірів по інтервалах.

Почнемо будувати гістограму з масштабування осей. По горизонтальній осі встановимо точки відліку: 0,03 – 0,04; 0,04 – 0,05; 0,05 – 0,06; 0,06 – 0,07; 0,07 – 0,08; 0,08 – 0,09; 0,09 – 0,10, як зроблено на рис 1. Нехай тепер товщина вимірювального щупа буде у 10 разів тонша від тої, що була спочатку. У межах одного інтервала тепер розміститься у 10 разів більше вимірювань, а гістограма матиме більш плавну криву розподілу.

Рис. 1. Гістограма до прикладу 1

Приклад 2. Визначити основні статистичні характеристики вибіркової сукупності і побудувати гістограму для вибірки з 10 замірів твердості паперорізальних ножів: 61, 62, 65, 66, 65, 65, 67, 63, 63, 64.

Аналіз отриманих замірів свідчить, що мінімальне значення твердості хmin = 61, а максимальне значення хmax = 67. Кількість інтервалів повинна бути не менша від тої, що дає формула

K = l + 3,2lgN = 1 + 3,2lg10 = 4,2.

Приймемо кількість інтервалів К = 4. Всі інтервали вибірки Δх мають однакову ширину, яка обчислюється за формулою:

Δх = (хmaxxmin)/K = (67 – 61)/4 = 1,5.

Інтервал 6162,5 має два виміри, інтервал 62,564 (включно вимір 64) – три виміри, інтервал 6465,5 – три виміри, інтервал 65,567 – два виміри.

Середнє арифметичне значення  визначається за формулою:

= ()/N = (261,75 + 363,25 + 364,75 + 266,25)/10 = 64,

де  – середнє арифметичне значення на і-му інтервалі, і = 1, 2, 3, 4.

Вибіркова дисперсія S2, котра характеризує варіацію спостережень або змінність значень у виборці, визначається за формулою

S2 = ()/(N – 1) = (2(61,75 – 64)2 + 3(63,25 – 64)2 +

+ 30,5625 + 25,0625)/9 = 23,625/9 = 2,625,

де (n – 1) – число ступенів свободи, яке дорівнює щільності незалежних значень, що беруть участь у визначенні будь-якого параметра статистичної сукупності. У даному випадку одна ступінь свободи витрачається на визначення середнього значения, без якого неможливо визначити дисперсію.

Середнє квадратичне або стандартне відхилення від середнього значення дорівнює:

За наведеними даними побудуємо гістограму, яка приведена на рис. 1

Рис. 1. Гістограма розподілу кількості спостережень


 

А также другие работы, которые могут Вас заинтересовать

67845. Дізнання та попереднє слідство 148.5 KB
  Органи попереднього розслідування виконують свою діяльність на основі законності. Вони повинні дотримуватися Конституції України ті інших законів. Конституцією гарантуються такі права та свободи громадян, як недоторканість особи, житла, які можуть бути затронуті в ході попереднього слідства.
67846. Слідчі дії 160 KB
  Досудове слідство являє собою сукупність різноманітних процесуальних дій, тобто цілого комплексу дій органів слідства, дізнання, прокурора, пов’язаних з розслідуванням злочинів при провадженні в кримінальних справах, дій - регламентованих кримінально-процесуальним законом.
67847. Притягнення особи як обвинуваченого 95 KB
  Головною умовою досудового слідства є забезпечення суворого дотримання законності. На жаль, у діяльності слідчих органів внутрішніх справ зустрічаються випадки порушення законності і прав громадян, у тому, числі, зокрема при виконанні комплексу дій.
67848. Зупинення і закінчення досудового розслідування 134 KB
  Про затримання обвинуваченого, якого розшукували і щодо якого обрано запобіжний захід у вигляді взяття під варту, орган розшуку негайно доповідає судді за місцем затримання. Суддя протягом двадцяти чотирьох годин зобов’язаний перевірити, чи дійсно затриманий є тією особою, яка розшукується...
67849. Нагляд прокурора і судовий контроль за додержанням законів під час досудового слідства 93.5 KB
  Прокуратура України становить єдину систему на яку покладаються серед інших функцій нагляд за додержанням законів органами які проводять оперативно розшукову діяльність дізнання досудове слідство.
67850. Підсудність та попередній розгляд справи суддею 115 KB
  Правосуддя як окремий вид державної діяльності й основний засіб реалізації судової влади полягає у розгляді і вирішенні окремих кримінальних, цивільних та адміністративних справ різними ланками судової системи судів загальної юрисдикції.
67851. Загальні положення судового огляду 97 KB
  Попередні стадії (порушення кримінальної справи, досудове розслідування, попередній розгляд справи судією) служать необхідними етапами підготовки до судового розгляду і вирішення справи по суті, а всі наступні, після означеної стадії — це засоби контролю за правильністю винесеного вироку...
67852. Особливі порядки провадження 104 KB
  В ході розслідування кримінальних справ може виникати така ситуація, коли замість звичного, загального для більшості справ порядку провадження, може бути запроваджений інший порядок розслідування, з певними особливостями стосовно віку, характеру стану особи, та порядку притягнення її до кримінальної відповідальності.
67853. Международные правовые отношения в сфере уголовного судопроизводства 151 KB
  Организация работы следственных подразделений по выполнению международно-правовых поручений и сотрудничество с правоохранительными органами иностранных государств Взаимодействие государств в сфере уголовной юстиции Действующее уголовно-процессуальное законодательство Украины...