15716

ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН

Лекция

Математика и математический анализ

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ СПОСТЕРЕЖЕНЬ Модуль 2: ОСНОВНІ ХАРАКТЕРИСТИКИ ОБРОБЛЕННЯ ДАНИХ Лекція 10. ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН План лекції 7: 10.1. Щільність ймовірності випадкових величин 10.2. Числові характеристики випадкови

Украинкский

2013-06-15

1.22 MB

5 чел.

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ

СПОСТЕРЕЖЕНЬ

Модуль 2: ОСНОВНІ ХАРАКТЕРИСТИКИ ОБРОБЛЕННЯ ДАНИХ

Лекція 10. ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН

План лекції 7:

10.1. Щільність ймовірності випадкових величин

10.2. Числові характеристики випадкових величин

10.3. Гістограми розподілу випадкових величин

10.1. Щільність ймовірності випадкових величин

Випадковою величиною називається змінна, яка приймає своє чисельне (рос. численное) значення залежно від результату випадкового експерименту. Якщо результатом випробування є вимірювання фізичної величини, то її вважа-ють випадковою величиною, а виміряне значення є її чисельним значенням.

Випадкова величина х може бути дискретною або неперервною. Наприклад, випадкова величина, пов’язана з підкиданням гральної кості, вважається дискретною з результатом у вигляді цілих чисел від 1 до 6, тоді як проміжки часу між надходженням замовлень в систему обслуговування вважаються неперервною випадковою величиною з додатними значеннями.

Як неперервна, так і дискретна випадкова величина має щільність розподілу ймовірностей, яку часто називають просто щільність ймовірності і позначають як f(x) (для неперервної випадкової величини) або р(х) (для дискретної випадкової величини). Щільності ймовірностей повинні задовольняти умовам  невід’ємності:

р(х) ≥ 0 (для дискретної випадкової величини),

f(x) ≥ 0 (для неперервної випадкової величини)

та умовам нормування:

для дискретної випадкової величини,

для неперервної випадкової величини.

Умова невід’ємності для неперервних та дискретних розподілень означає, що щільність ймовірності не може приймати від’ємні значення (у протилежному випадку ймовірність деяких подій могла б бути від’ємною). Умова нормування свідчить про те, що сума ймовірностей по усьому простору подій повинна дорівнювати одиниці.

Найважливішею імовірнісною характеристикою випадкової величини є функція розподілення, яка визначається таким чином:

Р{xX} =  для дискретної випадкової величини,

Р{xX} = для неперервної випадкової величини.

Приклад 1. Розглянемо випадок з підкиданням гральної кості. Результат гри може приймати шість різних значень x = {1, 2, 3, 4, 5, 6}, де х – випадкова величина, що приймає шість різних цілих значень з однаковими ймовірно-стями, котрі дорівнюють 1/6. Цю випадкову величину x подамо таблицею 1:

Таблиця 1 –  Вихідні дані для побудови закону розподілу

Х

1

2

3

4

5

6

р(х)

1/6

1/6

1/6

1/6

1/6

1/6

Така таблиця називається законом розподілення ймовірностей дискрет-ної випадкової величини, котрий надає повну інформацію про цю величину. У верхньому рядку зазначено усі можливі чисельні значення, а у нижній – відповідні їм ймовірності.

Щільність ймовірності і функція розподілу ймовірності випадкової величини х визначаються відповідно таким чином:

, х = 1, 2, 3, 4, 5, 6 щільність ймовірності,

, Х = 1, 2, 3, 4, 5, 6.

Графіки цих двох функцій приведені на рис. 1. Щільність ймовірності р(х) являє собою рівномірну дискретну функцію, оскільки будь-які значення випадкової величини сприймаються з однаковими ймовірностями.

Дискретний розподіл може мати безкінечну кількість можливих значень, проте ця множина значень повинна бути зчисленною. В силу умови нормування значення ймовірностей у цьому випадку повинні становитися безкінечно малими.

Рис. 1. Дискретний рівномірний закон розподілу  

Неперервною випадковою величиною називається величина, котра може приймати будь-яке значення із заданого скінченого числового іинтервалу. Інакше кажучи, неперервна випадкова величина завжди приймає незчислену множину значень, а ймовірність того, що вона прийме у точності будь-яке задане значення, дорівнює нулю.

Тому для неперервної випадкової величини має сенс говорити тільки про ймовірність попасти в деякий числовий інтервал. Якщо взяти безкінечно малий інтервал від х до х + dx, то й імовірність dp попасти в нього буде безкінечно малою, а тому її можна вважати пропорційною dx, тобто

dp = p(x<X<dx) = f(x)dx,

де коефіцієнт пропорційності f(x) залежить від х і являє собою щільність ймовірності (або щільність розподілу).

Ймовірність випадкової величини Х попасти в скінчений інтервал (х1, х2) дорівнює

P(xl<X<x2) =.

Умова нормування неперервної випадкової величини має такий вигляд

= 1.

Функція щільності ймовірності не може бути відємною. Для виконання умови нормування вона повинна зникати на нескінченості.

В якості первісної функції F(x) для f(x) беруть функцію

F(x) =,

яка монотоно зростає від 0 до 1 і має простий імовірнісний сенс F(x)=Р(- <X< х). Таку функцію называють функцією розподілу неперервної випадкової величини.

Таким чином, для задання дискретної випадкової величини слід задати закон розподілення у вигдяді таблиці, а для задання неперервної випадкової величини слід задати щільність ймовірності f(х) або функцію розподілу F(x).

Приклад 2. Припустимо, що рівномірна щільність ймовірності f(x) неперервної випадкової величини х визначається співвідношенням:

, 0 ≤ х ≤ πl.

Тоді функція розподілу F(X) випадкової величини х обчислюється за формулою:

F(X) = Р{ xX } = , 0 ≤ Х ≤ πl.

Графіки щільності ймовірності f(x) та функції розподілення F(X) представлені на рис. 2.

Рис. 2. Щільність ймовірності  f(x) і функція розподілення F(x)

10.2. Числові характеристики випадкових величин

Для загальної характеристики властивостей одновимірної випадкової величини х використовуються дві числові характеристики: математичне сподівання (середнє значення) М{x} і дисперсія D{x}. Математичне сподівання визначає характеристику положення розподілу випадкової величини х на числовій осі відносно початку координат, а дисперсія є мірою її розкиду відносно математичного сподівання М{x}. Велике значення дисперсії свідчить про високий ступінь невизначеності в описанні випадкової змінної.

При заданій щільності ймовірності (р(х) або f(x) для дискретної або неперервної випадкової величини відповідно) величина математичного сподівання М{x} обчислюється за формулами:

М{x} =  для дискретної випадкової величини,

М{x} = для неперервної випадкової величини.

Дисперсія випадкової величини D{x} характеризує ступінь розсіювання довкола М{x} і дорівнює математичному сподіванню квадрата відхилення від М{x}, тобто

D{x} =М[(xМ{x})2]

або

D{x} = для дискретної випадкової величини,

D{x} = для неперервної випадкової величини.

Обґрунтованість висновку зазначених формул легше проглядається для дискретного розподілу. В цьому випадку М{x} представляє собою зважену суму дискретних значень х, D{x} – взважену суму квадратів відхилень випадкової величини х від М{x}. Випадок з неперервно розподіленою випадковою величиною можна інтерпретувати аналогічно, замінивши операцію інтегрування операцією підсумовуванням.

Дисперсія має вимірність квадрата вимірності випадкової величини. Тому вводять поняття середнього квадратичного відхилення σ(х) випадкової величини, яке дорівнює кореню квадратичному від дисперсії:

σ(х) = .

Крім математичного сподівання і середнього квадратичного відхилення, використовують й інші числові характеристики випадкових величин. Модою розподілення Мо(х) називають таке значення дискретної випадкової величины, для якої ймовірність максимальна. Для неперервної випадкової величини модою називають те значения х, для якого функція щільності ймовірності має максимум. Якщо мода одна, то розподілення  називається унімодальним, якщо декілька — мультимодальним.

Для неперервних розподілень використовують так звані квантилі, котрі представляють собою ті значення випадкової величини, які відділяють інтервали однакової ймовірності. Серед квантилів виокремлюють медіану 0,5х; квартилі  0,25x; 0,5х; 0,75х; децилі  0,1х; 0,2х; 0,4х; процентилі  0,01х, 0,02х, …, 0,99х. Очевидно, що

Р(Х < 0,05х) = Р(Х > 0,5х)  =  0,5  –  медіана,

Р(Х < 0,25х) = Р(Х> 0,75х) = 0,25  –  квартиль.

Для характеристики асиметрії (бокової скривленості) розподілу використо-вується коефіцієнт асиметрії

С3 = М(хМ(х))33(х).

Для характеристики вертикальної приплюснутості розподілу викорис-товується ексцес

Е = [М(хМ(х))4/σ 4(х)]3,

котрий показує відхилення існуючого розподілу від нормального, для якого функцією щільності ймовірності послуговує функция Гаусса.

Використовуються також такі числові характеристики випадкових величин, як коефіцієнт варіації  σ/М(х) та розмах мах Хmin).

Приклад 1. Знайти середнє арифметичне чисел х1, х2,   , хn для даних, приведених в таблиці 1

Таблиця 1

І

1

2

3

4

5

6

7

8

9

10

хі

25

30

22

22

54

36

41

47

25

40

за формулою

= (х1 + х2 + х3 + х4 + х5 + х6 + х7 + х8 + х9 + х10)/10 =

= (25 + 30 + 22 + 22 + 54 + 36 + 41 + 47 + 25 + 40)/10 = 34.

Знайти дисперсію чисел х1, х2,   , хn для даних таблиці 2 за формулою

Таблиця 2

і

1

2

3

4

5

6

7

8

9

10

Σ

хі

25

30

22

22

54

36

41

45

25

40

340

хі-

-9

-4

-12

-12

20

2

7

11

-9

6

0

(хі-)2

81

16

144

144

400

4

49

121

81

36

1076

D = [(х1  )2 + (х2  )2 + … + 10  )2]/10 =

= [(25  34)2 + (30  34)2 + … + (40  34)2]/10 = 107,6.

Вичислити середнє квадратичне відхилення величин х1, х2, … , х10 від їх середнього значення за формулою

Дисперсію можна тлумачити як середню арифметичну квадратів різниць (х1  ), (х2  ), … (хn  ).

10.3. Гістограми розподілу випадкових величин

Вимірюючи деяку величину багато разів, ми отримуємо кожен відлік у вигляді певного дискретного значення. Ці значення можуть збігатися, можуть знаходитися близько одне до одного або далеко. Побачити, як часто ми одержували те або інше значення, зовсім не важко. Для цього достатньо побудувати гістограму, яка графічно відображає густоту розподілу ймовірностей випадкової величини.

Приклад 1. На кораблях типу «Фізик Вавілов» вал прокладається на підшипниках кочення діаметром 700 мм. Перед навішуванням на судовий вал у підшипників перевіряється зазор прибором з ціною розподілу 00,1. Результати вимірювання представлені в таблиці 1 як відхилення від номінального значення діаметра в міліметрах.

З 35 виконаних вимірів відкинуто три виміри 0,11; 0,12; 0,13 як помилкові. До розрахунку було подано 32 виміри. На основі найбільшого (Хмах = 0,10) і найменшого значення (Хmin = 0,03) підраховано ширину розподілу або поле розсіювання: ΔХ = Хмах – Хmin = 0,10 – 0,03 = 0,07.

Таблиця 1 – Результати вимірювання спостережень

0,07

0,05

0,05

0,06

0,06

0,08

0,08

0,03

0,07

0,06

0,08

0,06

0,06

0,07

0,05

0,03

0,07

0,07

0,08

0,07

0,10

0,08

0,08

0,06

0,05

0,04

0,07

0,10

0,06

0,07

0,04

0,07

0,11

0,12

0,13

Якщо кількість спостережень у виборці понад 20, то для систематизації та упорядкування вибірки весь діапазон значень розбивається на інтервали. Кількість інтервалів визначається за формулою:

k = 1 + 3,2lgn.

При виборі числа інтервалів кількість їх повинна бути не менше 67 при п = 30 .. 100 i не менше 915 при п > 100. Покладемо, що число інтервалів дорівнює к = 7. Тоді ціна інтервалу дорівнюватиме

Δх = ΔХ / k = 0,07 / 7 = 0,01.

Кількість значень ni, які потрапили в один із інтервалів, визначають частоту потрапляння в інтервал.

Упорядкований ряд середніх значень хi інтервалів зі зростанням називається статистичним рядом.

Графічне зображення статистичного ряду, координатами якого є частота інтервалу (вертикальна вісь y) і довжина інтервалу (горизонтальна вісь х), називається гістограмою.

Для побудови гістограми спочатку слід підрахувати частоти емпіричного розподілу за допомогою таблиці 2.

Таблица2 – Частоти емпіричного розподілу

Інтервали

Підрахунок частот позначками

Частота

Від

до

0,03

0,04

ІІ

2

0,04

0,05

ІІ

2

0,05

0,06

ІІІІ

4

0,06

0,07

ІІІІІІІ

7

0,07

0,08

ІІІІІІІІІ

9

0,08

0,09

ІІІІІІ

6

0,09

0,03

ІІ

2

Ліворуч вписуються інтервали від Хmin до (Хmin + с), від (Xmin + с) до (Хmin + 2с) i т.д. У кожен інтервал включаються розміри, що лежать у межах від найменшого значення інтервалу включно до найбільшого значення інтервалу, кpiм його. Праворуч за допомогою позначок роблять підрахунок числа спостережених poзмірів по інтервалах.

Почнемо будувати гістограму з масштабування осей. По горизонтальній осі встановимо точки відліку: 0,03 – 0,04; 0,04 – 0,05; 0,05 – 0,06; 0,06 – 0,07; 0,07 – 0,08; 0,08 – 0,09; 0,09 – 0,10, як зроблено на рис 1. Нехай тепер товщина вимірювального щупа буде у 10 разів тонша від тої, що була спочатку. У межах одного інтервала тепер розміститься у 10 разів більше вимірювань, а гістограма матиме більш плавну криву розподілу.

Рис. 1. Гістограма до прикладу 1

Приклад 2. Визначити основні статистичні характеристики вибіркової сукупності і побудувати гістограму для вибірки з 10 замірів твердості паперорізальних ножів: 61, 62, 65, 66, 65, 65, 67, 63, 63, 64.

Аналіз отриманих замірів свідчить, що мінімальне значення твердості хmin = 61, а максимальне значення хmax = 67. Кількість інтервалів повинна бути не менша від тої, що дає формула

K = l + 3,2lgN = 1 + 3,2lg10 = 4,2.

Приймемо кількість інтервалів К = 4. Всі інтервали вибірки Δх мають однакову ширину, яка обчислюється за формулою:

Δх = (хmaxxmin)/K = (67 – 61)/4 = 1,5.

Інтервал 6162,5 має два виміри, інтервал 62,564 (включно вимір 64) – три виміри, інтервал 6465,5 – три виміри, інтервал 65,567 – два виміри.

Середнє арифметичне значення  визначається за формулою:

= ()/N = (261,75 + 363,25 + 364,75 + 266,25)/10 = 64,

де  – середнє арифметичне значення на і-му інтервалі, і = 1, 2, 3, 4.

Вибіркова дисперсія S2, котра характеризує варіацію спостережень або змінність значень у виборці, визначається за формулою

S2 = ()/(N – 1) = (2(61,75 – 64)2 + 3(63,25 – 64)2 +

+ 30,5625 + 25,0625)/9 = 23,625/9 = 2,625,

де (n – 1) – число ступенів свободи, яке дорівнює щільності незалежних значень, що беруть участь у визначенні будь-якого параметра статистичної сукупності. У даному випадку одна ступінь свободи витрачається на визначення середнього значения, без якого неможливо визначити дисперсію.

Середнє квадратичне або стандартне відхилення від середнього значення дорівнює:

За наведеними даними побудуємо гістограму, яка приведена на рис. 1

Рис. 1. Гістограма розподілу кількості спостережень


 

А также другие работы, которые могут Вас заинтересовать

53539. Ведущие европейские страны в годы I мировой войны 42.32 KB
  Интересам повышения обороноспособности служила реорганизация управления страной. В августе 1914 г. либералы, консерваторы и лейбористы договорились о взаимном отказе от соперничества на внеочередных выборах в Палату общин вместо досрочно выбывших депутатов и прекратили традиционную политическую борьбу в парламенте
53540. Разработка технологического процесса изготовления отливки «Котел» 4.38 MB
  В расчетно-пояснительной записке приведены: технологичность отливки и способ её изготовления, задачами которых являются выбор способа формовки, выбор положения отливки в форме, выбор поверхности разъема, сплав, минимальная толщина стенки, радиусы сопряжений стенок, литейные радиусы
53541. Управлінські рішення 25.34 KB
  Управлінське рішення — це вибір альтернативи, речове відбиття управління, певною мірою його підсумок. Воно є результатом обдумувань, дій та намірів, висновків, міркувань, обговорень, постанов спрямованих на реалізацію цілей управління.
53542. Вульф Григорій (Юрій) Вікторович 202.18 KB
  Георгій Вікторович Вульф народився в 1863 р. в м. Чернігові. Закінчив 6 чоловічу класичну гімназію у Варшаві в 1881 р. і вступив до Варшавського університету, на природне відділення фізико-математичного факультету. З 2-го курсу почав працювати з кристалографії
53544. Генезис научного направления финансовый менеджмент, цели и задачи финансового менеджмента 14.57 KB
  Как известно языковая норма – регулятор правильности литературного языка и условие его устойчивости стабильности. Лексические повтор слова синонимическая замена использование антонимов многозначных слов однокоренных слов слов одной тематической группы ключевые слова Морфологические замена существительных и других частей речи местоимениями видовременное единство глаголов наречий места и времени вводных слов и предложений союзов частиц и др. Синтаксические наличие вопросноответной формы синтаксического параллелизма определенного...
53545. Нашего стола царица или выходец из Южной Америки 95.5 KB
  Цель: расширить знания об одной из основных овощных культур, развивать художественные и творческие способности учащихся, учить анализу собранного материала, воспитывать уважение к людям труда.
53546. ИГРЫ НА УРОКЕ ИНОСТРАННОГО ЯЗЫКА 85.5 KB
  Можно проводить игры на аудирование текста, не имея ни картинок, ни рисунков, ни заранее приготовленных вопросов, ни пунктов текста и т.д., это игры на развитие аудитивной памяти. Учитель читает текст в нормальном темпе, играющие слушают