15716

ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН

Лекция

Математика и математический анализ

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ СПОСТЕРЕЖЕНЬ Модуль 2: ОСНОВНІ ХАРАКТЕРИСТИКИ ОБРОБЛЕННЯ ДАНИХ Лекція 10. ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН План лекції 7: 10.1. Щільність ймовірності випадкових величин 10.2. Числові характеристики випадкови

Украинкский

2013-06-15

1.22 MB

5 чел.

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ

СПОСТЕРЕЖЕНЬ

Модуль 2: ОСНОВНІ ХАРАКТЕРИСТИКИ ОБРОБЛЕННЯ ДАНИХ

Лекція 10. ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН

План лекції 7:

10.1. Щільність ймовірності випадкових величин

10.2. Числові характеристики випадкових величин

10.3. Гістограми розподілу випадкових величин

10.1. Щільність ймовірності випадкових величин

Випадковою величиною називається змінна, яка приймає своє чисельне (рос. численное) значення залежно від результату випадкового експерименту. Якщо результатом випробування є вимірювання фізичної величини, то її вважа-ють випадковою величиною, а виміряне значення є її чисельним значенням.

Випадкова величина х може бути дискретною або неперервною. Наприклад, випадкова величина, пов’язана з підкиданням гральної кості, вважається дискретною з результатом у вигляді цілих чисел від 1 до 6, тоді як проміжки часу між надходженням замовлень в систему обслуговування вважаються неперервною випадковою величиною з додатними значеннями.

Як неперервна, так і дискретна випадкова величина має щільність розподілу ймовірностей, яку часто називають просто щільність ймовірності і позначають як f(x) (для неперервної випадкової величини) або р(х) (для дискретної випадкової величини). Щільності ймовірностей повинні задовольняти умовам  невід’ємності:

р(х) ≥ 0 (для дискретної випадкової величини),

f(x) ≥ 0 (для неперервної випадкової величини)

та умовам нормування:

для дискретної випадкової величини,

для неперервної випадкової величини.

Умова невід’ємності для неперервних та дискретних розподілень означає, що щільність ймовірності не може приймати від’ємні значення (у протилежному випадку ймовірність деяких подій могла б бути від’ємною). Умова нормування свідчить про те, що сума ймовірностей по усьому простору подій повинна дорівнювати одиниці.

Найважливішею імовірнісною характеристикою випадкової величини є функція розподілення, яка визначається таким чином:

Р{xX} =  для дискретної випадкової величини,

Р{xX} = для неперервної випадкової величини.

Приклад 1. Розглянемо випадок з підкиданням гральної кості. Результат гри може приймати шість різних значень x = {1, 2, 3, 4, 5, 6}, де х – випадкова величина, що приймає шість різних цілих значень з однаковими ймовірно-стями, котрі дорівнюють 1/6. Цю випадкову величину x подамо таблицею 1:

Таблиця 1 –  Вихідні дані для побудови закону розподілу

Х

1

2

3

4

5

6

р(х)

1/6

1/6

1/6

1/6

1/6

1/6

Така таблиця називається законом розподілення ймовірностей дискрет-ної випадкової величини, котрий надає повну інформацію про цю величину. У верхньому рядку зазначено усі можливі чисельні значення, а у нижній – відповідні їм ймовірності.

Щільність ймовірності і функція розподілу ймовірності випадкової величини х визначаються відповідно таким чином:

, х = 1, 2, 3, 4, 5, 6 щільність ймовірності,

, Х = 1, 2, 3, 4, 5, 6.

Графіки цих двох функцій приведені на рис. 1. Щільність ймовірності р(х) являє собою рівномірну дискретну функцію, оскільки будь-які значення випадкової величини сприймаються з однаковими ймовірностями.

Дискретний розподіл може мати безкінечну кількість можливих значень, проте ця множина значень повинна бути зчисленною. В силу умови нормування значення ймовірностей у цьому випадку повинні становитися безкінечно малими.

Рис. 1. Дискретний рівномірний закон розподілу  

Неперервною випадковою величиною називається величина, котра може приймати будь-яке значення із заданого скінченого числового іинтервалу. Інакше кажучи, неперервна випадкова величина завжди приймає незчислену множину значень, а ймовірність того, що вона прийме у точності будь-яке задане значення, дорівнює нулю.

Тому для неперервної випадкової величини має сенс говорити тільки про ймовірність попасти в деякий числовий інтервал. Якщо взяти безкінечно малий інтервал від х до х + dx, то й імовірність dp попасти в нього буде безкінечно малою, а тому її можна вважати пропорційною dx, тобто

dp = p(x<X<dx) = f(x)dx,

де коефіцієнт пропорційності f(x) залежить від х і являє собою щільність ймовірності (або щільність розподілу).

Ймовірність випадкової величини Х попасти в скінчений інтервал (х1, х2) дорівнює

P(xl<X<x2) =.

Умова нормування неперервної випадкової величини має такий вигляд

= 1.

Функція щільності ймовірності не може бути відємною. Для виконання умови нормування вона повинна зникати на нескінченості.

В якості первісної функції F(x) для f(x) беруть функцію

F(x) =,

яка монотоно зростає від 0 до 1 і має простий імовірнісний сенс F(x)=Р(- <X< х). Таку функцію называють функцією розподілу неперервної випадкової величини.

Таким чином, для задання дискретної випадкової величини слід задати закон розподілення у вигдяді таблиці, а для задання неперервної випадкової величини слід задати щільність ймовірності f(х) або функцію розподілу F(x).

Приклад 2. Припустимо, що рівномірна щільність ймовірності f(x) неперервної випадкової величини х визначається співвідношенням:

, 0 ≤ х ≤ πl.

Тоді функція розподілу F(X) випадкової величини х обчислюється за формулою:

F(X) = Р{ xX } = , 0 ≤ Х ≤ πl.

Графіки щільності ймовірності f(x) та функції розподілення F(X) представлені на рис. 2.

Рис. 2. Щільність ймовірності  f(x) і функція розподілення F(x)

10.2. Числові характеристики випадкових величин

Для загальної характеристики властивостей одновимірної випадкової величини х використовуються дві числові характеристики: математичне сподівання (середнє значення) М{x} і дисперсія D{x}. Математичне сподівання визначає характеристику положення розподілу випадкової величини х на числовій осі відносно початку координат, а дисперсія є мірою її розкиду відносно математичного сподівання М{x}. Велике значення дисперсії свідчить про високий ступінь невизначеності в описанні випадкової змінної.

При заданій щільності ймовірності (р(х) або f(x) для дискретної або неперервної випадкової величини відповідно) величина математичного сподівання М{x} обчислюється за формулами:

М{x} =  для дискретної випадкової величини,

М{x} = для неперервної випадкової величини.

Дисперсія випадкової величини D{x} характеризує ступінь розсіювання довкола М{x} і дорівнює математичному сподіванню квадрата відхилення від М{x}, тобто

D{x} =М[(xМ{x})2]

або

D{x} = для дискретної випадкової величини,

D{x} = для неперервної випадкової величини.

Обґрунтованість висновку зазначених формул легше проглядається для дискретного розподілу. В цьому випадку М{x} представляє собою зважену суму дискретних значень х, D{x} – взважену суму квадратів відхилень випадкової величини х від М{x}. Випадок з неперервно розподіленою випадковою величиною можна інтерпретувати аналогічно, замінивши операцію інтегрування операцією підсумовуванням.

Дисперсія має вимірність квадрата вимірності випадкової величини. Тому вводять поняття середнього квадратичного відхилення σ(х) випадкової величини, яке дорівнює кореню квадратичному від дисперсії:

σ(х) = .

Крім математичного сподівання і середнього квадратичного відхилення, використовують й інші числові характеристики випадкових величин. Модою розподілення Мо(х) називають таке значення дискретної випадкової величины, для якої ймовірність максимальна. Для неперервної випадкової величини модою називають те значения х, для якого функція щільності ймовірності має максимум. Якщо мода одна, то розподілення  називається унімодальним, якщо декілька — мультимодальним.

Для неперервних розподілень використовують так звані квантилі, котрі представляють собою ті значення випадкової величини, які відділяють інтервали однакової ймовірності. Серед квантилів виокремлюють медіану 0,5х; квартилі  0,25x; 0,5х; 0,75х; децилі  0,1х; 0,2х; 0,4х; процентилі  0,01х, 0,02х, …, 0,99х. Очевидно, що

Р(Х < 0,05х) = Р(Х > 0,5х)  =  0,5  –  медіана,

Р(Х < 0,25х) = Р(Х> 0,75х) = 0,25  –  квартиль.

Для характеристики асиметрії (бокової скривленості) розподілу використо-вується коефіцієнт асиметрії

С3 = М(хМ(х))33(х).

Для характеристики вертикальної приплюснутості розподілу викорис-товується ексцес

Е = [М(хМ(х))4/σ 4(х)]3,

котрий показує відхилення існуючого розподілу від нормального, для якого функцією щільності ймовірності послуговує функция Гаусса.

Використовуються також такі числові характеристики випадкових величин, як коефіцієнт варіації  σ/М(х) та розмах мах Хmin).

Приклад 1. Знайти середнє арифметичне чисел х1, х2,   , хn для даних, приведених в таблиці 1

Таблиця 1

І

1

2

3

4

5

6

7

8

9

10

хі

25

30

22

22

54

36

41

47

25

40

за формулою

= (х1 + х2 + х3 + х4 + х5 + х6 + х7 + х8 + х9 + х10)/10 =

= (25 + 30 + 22 + 22 + 54 + 36 + 41 + 47 + 25 + 40)/10 = 34.

Знайти дисперсію чисел х1, х2,   , хn для даних таблиці 2 за формулою

Таблиця 2

і

1

2

3

4

5

6

7

8

9

10

Σ

хі

25

30

22

22

54

36

41

45

25

40

340

хі-

-9

-4

-12

-12

20

2

7

11

-9

6

0

(хі-)2

81

16

144

144

400

4

49

121

81

36

1076

D = [(х1  )2 + (х2  )2 + … + 10  )2]/10 =

= [(25  34)2 + (30  34)2 + … + (40  34)2]/10 = 107,6.

Вичислити середнє квадратичне відхилення величин х1, х2, … , х10 від їх середнього значення за формулою

Дисперсію можна тлумачити як середню арифметичну квадратів різниць (х1  ), (х2  ), … (хn  ).

10.3. Гістограми розподілу випадкових величин

Вимірюючи деяку величину багато разів, ми отримуємо кожен відлік у вигляді певного дискретного значення. Ці значення можуть збігатися, можуть знаходитися близько одне до одного або далеко. Побачити, як часто ми одержували те або інше значення, зовсім не важко. Для цього достатньо побудувати гістограму, яка графічно відображає густоту розподілу ймовірностей випадкової величини.

Приклад 1. На кораблях типу «Фізик Вавілов» вал прокладається на підшипниках кочення діаметром 700 мм. Перед навішуванням на судовий вал у підшипників перевіряється зазор прибором з ціною розподілу 00,1. Результати вимірювання представлені в таблиці 1 як відхилення від номінального значення діаметра в міліметрах.

З 35 виконаних вимірів відкинуто три виміри 0,11; 0,12; 0,13 як помилкові. До розрахунку було подано 32 виміри. На основі найбільшого (Хмах = 0,10) і найменшого значення (Хmin = 0,03) підраховано ширину розподілу або поле розсіювання: ΔХ = Хмах – Хmin = 0,10 – 0,03 = 0,07.

Таблиця 1 – Результати вимірювання спостережень

0,07

0,05

0,05

0,06

0,06

0,08

0,08

0,03

0,07

0,06

0,08

0,06

0,06

0,07

0,05

0,03

0,07

0,07

0,08

0,07

0,10

0,08

0,08

0,06

0,05

0,04

0,07

0,10

0,06

0,07

0,04

0,07

0,11

0,12

0,13

Якщо кількість спостережень у виборці понад 20, то для систематизації та упорядкування вибірки весь діапазон значень розбивається на інтервали. Кількість інтервалів визначається за формулою:

k = 1 + 3,2lgn.

При виборі числа інтервалів кількість їх повинна бути не менше 67 при п = 30 .. 100 i не менше 915 при п > 100. Покладемо, що число інтервалів дорівнює к = 7. Тоді ціна інтервалу дорівнюватиме

Δх = ΔХ / k = 0,07 / 7 = 0,01.

Кількість значень ni, які потрапили в один із інтервалів, визначають частоту потрапляння в інтервал.

Упорядкований ряд середніх значень хi інтервалів зі зростанням називається статистичним рядом.

Графічне зображення статистичного ряду, координатами якого є частота інтервалу (вертикальна вісь y) і довжина інтервалу (горизонтальна вісь х), називається гістограмою.

Для побудови гістограми спочатку слід підрахувати частоти емпіричного розподілу за допомогою таблиці 2.

Таблица2 – Частоти емпіричного розподілу

Інтервали

Підрахунок частот позначками

Частота

Від

до

0,03

0,04

ІІ

2

0,04

0,05

ІІ

2

0,05

0,06

ІІІІ

4

0,06

0,07

ІІІІІІІ

7

0,07

0,08

ІІІІІІІІІ

9

0,08

0,09

ІІІІІІ

6

0,09

0,03

ІІ

2

Ліворуч вписуються інтервали від Хmin до (Хmin + с), від (Xmin + с) до (Хmin + 2с) i т.д. У кожен інтервал включаються розміри, що лежать у межах від найменшого значення інтервалу включно до найбільшого значення інтервалу, кpiм його. Праворуч за допомогою позначок роблять підрахунок числа спостережених poзмірів по інтервалах.

Почнемо будувати гістограму з масштабування осей. По горизонтальній осі встановимо точки відліку: 0,03 – 0,04; 0,04 – 0,05; 0,05 – 0,06; 0,06 – 0,07; 0,07 – 0,08; 0,08 – 0,09; 0,09 – 0,10, як зроблено на рис 1. Нехай тепер товщина вимірювального щупа буде у 10 разів тонша від тої, що була спочатку. У межах одного інтервала тепер розміститься у 10 разів більше вимірювань, а гістограма матиме більш плавну криву розподілу.

Рис. 1. Гістограма до прикладу 1

Приклад 2. Визначити основні статистичні характеристики вибіркової сукупності і побудувати гістограму для вибірки з 10 замірів твердості паперорізальних ножів: 61, 62, 65, 66, 65, 65, 67, 63, 63, 64.

Аналіз отриманих замірів свідчить, що мінімальне значення твердості хmin = 61, а максимальне значення хmax = 67. Кількість інтервалів повинна бути не менша від тої, що дає формула

K = l + 3,2lgN = 1 + 3,2lg10 = 4,2.

Приймемо кількість інтервалів К = 4. Всі інтервали вибірки Δх мають однакову ширину, яка обчислюється за формулою:

Δх = (хmaxxmin)/K = (67 – 61)/4 = 1,5.

Інтервал 6162,5 має два виміри, інтервал 62,564 (включно вимір 64) – три виміри, інтервал 6465,5 – три виміри, інтервал 65,567 – два виміри.

Середнє арифметичне значення  визначається за формулою:

= ()/N = (261,75 + 363,25 + 364,75 + 266,25)/10 = 64,

де  – середнє арифметичне значення на і-му інтервалі, і = 1, 2, 3, 4.

Вибіркова дисперсія S2, котра характеризує варіацію спостережень або змінність значень у виборці, визначається за формулою

S2 = ()/(N – 1) = (2(61,75 – 64)2 + 3(63,25 – 64)2 +

+ 30,5625 + 25,0625)/9 = 23,625/9 = 2,625,

де (n – 1) – число ступенів свободи, яке дорівнює щільності незалежних значень, що беруть участь у визначенні будь-якого параметра статистичної сукупності. У даному випадку одна ступінь свободи витрачається на визначення середнього значения, без якого неможливо визначити дисперсію.

Середнє квадратичне або стандартне відхилення від середнього значення дорівнює:

За наведеними даними побудуємо гістограму, яка приведена на рис. 1

Рис. 1. Гістограма розподілу кількості спостережень


 

А также другие работы, которые могут Вас заинтересовать

26662. Высотная поясность, высотная зональность 43 KB
  Высотный пояс высотная ландшафтная зона единица высотнозонального расчленения ландшафтов в горах. Высотный пояс образует полосу сравнительно однородную по природным условиям часто прерывистую Характеристика явления Высотная поясность объясняется изменением климата с высотой: на 1 км подъёма температура воздуха снижается в среднем на 6 C уменьшается давление воздуха его запылённость возрастает интенсивность солнечной радиации до высоты 2 3 км увеличивается облачность и количество осадков. По мере нарастания высоты происходит смена...
26663. Географическая оболочка 31.5 KB
  Взаимное проникновение друг в друга слагающих географическую оболочку Земли газовой водной живой и минеральных оболочек и их взаимодействие определяет целостность географической оболочки. Знание закона целостности географической оболочки имеет большое практическое значение. Изменение одной из оболочек географической оболочки отражается и на всех других. Он характеризовался ведущей ролью живых существ в развитии и формировании географической оболочки.
26664. Географи́ческая оболо́чка 45 KB
  Земная кора Земная кора это верхняя часть твёрдой земли. Температура убывает с ростом высоты со средним вертикальным градиентом 065 100 м За нормальные условия у поверхности Земли приняты: плотность 12 кг м3 барометрическое давление 10134 кПа температура плюс 20 C и относительная влажность 50 . Гидросфера Гидросфера совокупность всех водных запасов Земли.
26665. Геосистема 28 KB
  σύστημα целое составленное из частей фундаментальная категория геоэкологии обозначающая совокупность компонентов географической оболочки объединённых потоками энергии и вещества. Геосистемы это природногеографические единства всех возможных категорий от планетарной геосистемы географической оболочки до элементарной геосистемы физикогеографической фации определение В. Сочавы Масштаб геосистем Выделяют три уровня геосистем: Глобальная геосистема синоним географической оболочки. Региональная геосистема представляет собой...
26666. Эстетическая ценность урбанизированного ландшафта 1.67 MB
  Нами было выявлено несколько конструктивных ошибок большинства авторов: склонность к популяризации научных изысканий изложения работ отталкивание от философских категорий непрактичный аспект конфликтность оперируемых понятий игнорирование факта раздела восприятия человека на три уровня. В частности в медицине и психологии уже существуют некоторые представления о психофизическом воздействии цвета на организм человека.3 Оперирование древними инстинктами человека в современном рекламном дизайне Глава 3. Интерпретировать факторы восприятия...
26667. Экологические проблемы нефтедобывающей промышленности 8.38 MB
  Историческая справка о нефти. Возникновение нефти . Добыча нефти и газа . Современная технология добычи нефти .
26668. Утилизация и захоронение РАО в Архангельской области (Миронова гора) 12.32 KB
  Об этом на последнем заседании координационного совета по вопросам организации мероприятий по охране окружающей среды сообщил начальник отдела ядерной и радиационной безопасности Севмашпредприятия Михаил Малинин. Горожанам думается небесполезно узнать что специалистами ФГУП ВНИИпромтехнологии в свое время были разработаны мероприятия по организации санитарнопропускного режима и созданию системы непрерывного радиационного контроля физической защиты систем энергопитания и связи на Мироновой горе. В частности член координационного...
26669. Антропогенные опасности на территории Архангельской области 74.84 KB
  Ломоносова Естественногеографический факультет Географии и геоэкологии Реферат на тему: Антропогенные опасности на территории Архангельской области Выполнил: студент 4 курса отделения природопользования ...
26670. Воздействие нефтедобычи в НАО на многолетние мерзлые породы 17.11 KB
  В Государственном докладе О состоянии и об охране окружающей среды Российской Федерации в 2005 году отмечается что наибольший суммарный объем выбросов в атмосферу зафиксирован для предприятий по добыче сырой нефти и нефтяного попутного газа 41 млн. м свежей воды в том числе при добыче сырой нефти и природного газа 7015 млн. Аэробная зона источник выделения углекислого газа образующегося при разложении органики в кислородной среде а анаэробная зона продуцирует метан. Парниковый эффект метана превышает действие равного количества...