15716

ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН

Лекция

Математика и математический анализ

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ СПОСТЕРЕЖЕНЬ Модуль 2: ОСНОВНІ ХАРАКТЕРИСТИКИ ОБРОБЛЕННЯ ДАНИХ Лекція 10. ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН План лекції 7: 10.1. Щільність ймовірності випадкових величин 10.2. Числові характеристики випадкови

Украинкский

2013-06-15

1.22 MB

5 чел.

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ

СПОСТЕРЕЖЕНЬ

Модуль 2: ОСНОВНІ ХАРАКТЕРИСТИКИ ОБРОБЛЕННЯ ДАНИХ

Лекція 10. ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН

План лекції 7:

10.1. Щільність ймовірності випадкових величин

10.2. Числові характеристики випадкових величин

10.3. Гістограми розподілу випадкових величин

10.1. Щільність ймовірності випадкових величин

Випадковою величиною називається змінна, яка приймає своє чисельне (рос. численное) значення залежно від результату випадкового експерименту. Якщо результатом випробування є вимірювання фізичної величини, то її вважа-ють випадковою величиною, а виміряне значення є її чисельним значенням.

Випадкова величина х може бути дискретною або неперервною. Наприклад, випадкова величина, пов’язана з підкиданням гральної кості, вважається дискретною з результатом у вигляді цілих чисел від 1 до 6, тоді як проміжки часу між надходженням замовлень в систему обслуговування вважаються неперервною випадковою величиною з додатними значеннями.

Як неперервна, так і дискретна випадкова величина має щільність розподілу ймовірностей, яку часто називають просто щільність ймовірності і позначають як f(x) (для неперервної випадкової величини) або р(х) (для дискретної випадкової величини). Щільності ймовірностей повинні задовольняти умовам  невід’ємності:

р(х) ≥ 0 (для дискретної випадкової величини),

f(x) ≥ 0 (для неперервної випадкової величини)

та умовам нормування:

для дискретної випадкової величини,

для неперервної випадкової величини.

Умова невід’ємності для неперервних та дискретних розподілень означає, що щільність ймовірності не може приймати від’ємні значення (у протилежному випадку ймовірність деяких подій могла б бути від’ємною). Умова нормування свідчить про те, що сума ймовірностей по усьому простору подій повинна дорівнювати одиниці.

Найважливішею імовірнісною характеристикою випадкової величини є функція розподілення, яка визначається таким чином:

Р{xX} =  для дискретної випадкової величини,

Р{xX} = для неперервної випадкової величини.

Приклад 1. Розглянемо випадок з підкиданням гральної кості. Результат гри може приймати шість різних значень x = {1, 2, 3, 4, 5, 6}, де х – випадкова величина, що приймає шість різних цілих значень з однаковими ймовірно-стями, котрі дорівнюють 1/6. Цю випадкову величину x подамо таблицею 1:

Таблиця 1 –  Вихідні дані для побудови закону розподілу

Х

1

2

3

4

5

6

р(х)

1/6

1/6

1/6

1/6

1/6

1/6

Така таблиця називається законом розподілення ймовірностей дискрет-ної випадкової величини, котрий надає повну інформацію про цю величину. У верхньому рядку зазначено усі можливі чисельні значення, а у нижній – відповідні їм ймовірності.

Щільність ймовірності і функція розподілу ймовірності випадкової величини х визначаються відповідно таким чином:

, х = 1, 2, 3, 4, 5, 6 щільність ймовірності,

, Х = 1, 2, 3, 4, 5, 6.

Графіки цих двох функцій приведені на рис. 1. Щільність ймовірності р(х) являє собою рівномірну дискретну функцію, оскільки будь-які значення випадкової величини сприймаються з однаковими ймовірностями.

Дискретний розподіл може мати безкінечну кількість можливих значень, проте ця множина значень повинна бути зчисленною. В силу умови нормування значення ймовірностей у цьому випадку повинні становитися безкінечно малими.

Рис. 1. Дискретний рівномірний закон розподілу  

Неперервною випадковою величиною називається величина, котра може приймати будь-яке значення із заданого скінченого числового іинтервалу. Інакше кажучи, неперервна випадкова величина завжди приймає незчислену множину значень, а ймовірність того, що вона прийме у точності будь-яке задане значення, дорівнює нулю.

Тому для неперервної випадкової величини має сенс говорити тільки про ймовірність попасти в деякий числовий інтервал. Якщо взяти безкінечно малий інтервал від х до х + dx, то й імовірність dp попасти в нього буде безкінечно малою, а тому її можна вважати пропорційною dx, тобто

dp = p(x<X<dx) = f(x)dx,

де коефіцієнт пропорційності f(x) залежить від х і являє собою щільність ймовірності (або щільність розподілу).

Ймовірність випадкової величини Х попасти в скінчений інтервал (х1, х2) дорівнює

P(xl<X<x2) =.

Умова нормування неперервної випадкової величини має такий вигляд

= 1.

Функція щільності ймовірності не може бути відємною. Для виконання умови нормування вона повинна зникати на нескінченості.

В якості первісної функції F(x) для f(x) беруть функцію

F(x) =,

яка монотоно зростає від 0 до 1 і має простий імовірнісний сенс F(x)=Р(- <X< х). Таку функцію называють функцією розподілу неперервної випадкової величини.

Таким чином, для задання дискретної випадкової величини слід задати закон розподілення у вигдяді таблиці, а для задання неперервної випадкової величини слід задати щільність ймовірності f(х) або функцію розподілу F(x).

Приклад 2. Припустимо, що рівномірна щільність ймовірності f(x) неперервної випадкової величини х визначається співвідношенням:

, 0 ≤ х ≤ πl.

Тоді функція розподілу F(X) випадкової величини х обчислюється за формулою:

F(X) = Р{ xX } = , 0 ≤ Х ≤ πl.

Графіки щільності ймовірності f(x) та функції розподілення F(X) представлені на рис. 2.

Рис. 2. Щільність ймовірності  f(x) і функція розподілення F(x)

10.2. Числові характеристики випадкових величин

Для загальної характеристики властивостей одновимірної випадкової величини х використовуються дві числові характеристики: математичне сподівання (середнє значення) М{x} і дисперсія D{x}. Математичне сподівання визначає характеристику положення розподілу випадкової величини х на числовій осі відносно початку координат, а дисперсія є мірою її розкиду відносно математичного сподівання М{x}. Велике значення дисперсії свідчить про високий ступінь невизначеності в описанні випадкової змінної.

При заданій щільності ймовірності (р(х) або f(x) для дискретної або неперервної випадкової величини відповідно) величина математичного сподівання М{x} обчислюється за формулами:

М{x} =  для дискретної випадкової величини,

М{x} = для неперервної випадкової величини.

Дисперсія випадкової величини D{x} характеризує ступінь розсіювання довкола М{x} і дорівнює математичному сподіванню квадрата відхилення від М{x}, тобто

D{x} =М[(xМ{x})2]

або

D{x} = для дискретної випадкової величини,

D{x} = для неперервної випадкової величини.

Обґрунтованість висновку зазначених формул легше проглядається для дискретного розподілу. В цьому випадку М{x} представляє собою зважену суму дискретних значень х, D{x} – взважену суму квадратів відхилень випадкової величини х від М{x}. Випадок з неперервно розподіленою випадковою величиною можна інтерпретувати аналогічно, замінивши операцію інтегрування операцією підсумовуванням.

Дисперсія має вимірність квадрата вимірності випадкової величини. Тому вводять поняття середнього квадратичного відхилення σ(х) випадкової величини, яке дорівнює кореню квадратичному від дисперсії:

σ(х) = .

Крім математичного сподівання і середнього квадратичного відхилення, використовують й інші числові характеристики випадкових величин. Модою розподілення Мо(х) називають таке значення дискретної випадкової величины, для якої ймовірність максимальна. Для неперервної випадкової величини модою називають те значения х, для якого функція щільності ймовірності має максимум. Якщо мода одна, то розподілення  називається унімодальним, якщо декілька — мультимодальним.

Для неперервних розподілень використовують так звані квантилі, котрі представляють собою ті значення випадкової величини, які відділяють інтервали однакової ймовірності. Серед квантилів виокремлюють медіану 0,5х; квартилі  0,25x; 0,5х; 0,75х; децилі  0,1х; 0,2х; 0,4х; процентилі  0,01х, 0,02х, …, 0,99х. Очевидно, що

Р(Х < 0,05х) = Р(Х > 0,5х)  =  0,5  –  медіана,

Р(Х < 0,25х) = Р(Х> 0,75х) = 0,25  –  квартиль.

Для характеристики асиметрії (бокової скривленості) розподілу використо-вується коефіцієнт асиметрії

С3 = М(хМ(х))33(х).

Для характеристики вертикальної приплюснутості розподілу викорис-товується ексцес

Е = [М(хМ(х))4/σ 4(х)]3,

котрий показує відхилення існуючого розподілу від нормального, для якого функцією щільності ймовірності послуговує функция Гаусса.

Використовуються також такі числові характеристики випадкових величин, як коефіцієнт варіації  σ/М(х) та розмах мах Хmin).

Приклад 1. Знайти середнє арифметичне чисел х1, х2,   , хn для даних, приведених в таблиці 1

Таблиця 1

І

1

2

3

4

5

6

7

8

9

10

хі

25

30

22

22

54

36

41

47

25

40

за формулою

= (х1 + х2 + х3 + х4 + х5 + х6 + х7 + х8 + х9 + х10)/10 =

= (25 + 30 + 22 + 22 + 54 + 36 + 41 + 47 + 25 + 40)/10 = 34.

Знайти дисперсію чисел х1, х2,   , хn для даних таблиці 2 за формулою

Таблиця 2

і

1

2

3

4

5

6

7

8

9

10

Σ

хі

25

30

22

22

54

36

41

45

25

40

340

хі-

-9

-4

-12

-12

20

2

7

11

-9

6

0

(хі-)2

81

16

144

144

400

4

49

121

81

36

1076

D = [(х1  )2 + (х2  )2 + … + 10  )2]/10 =

= [(25  34)2 + (30  34)2 + … + (40  34)2]/10 = 107,6.

Вичислити середнє квадратичне відхилення величин х1, х2, … , х10 від їх середнього значення за формулою

Дисперсію можна тлумачити як середню арифметичну квадратів різниць (х1  ), (х2  ), … (хn  ).

10.3. Гістограми розподілу випадкових величин

Вимірюючи деяку величину багато разів, ми отримуємо кожен відлік у вигляді певного дискретного значення. Ці значення можуть збігатися, можуть знаходитися близько одне до одного або далеко. Побачити, як часто ми одержували те або інше значення, зовсім не важко. Для цього достатньо побудувати гістограму, яка графічно відображає густоту розподілу ймовірностей випадкової величини.

Приклад 1. На кораблях типу «Фізик Вавілов» вал прокладається на підшипниках кочення діаметром 700 мм. Перед навішуванням на судовий вал у підшипників перевіряється зазор прибором з ціною розподілу 00,1. Результати вимірювання представлені в таблиці 1 як відхилення від номінального значення діаметра в міліметрах.

З 35 виконаних вимірів відкинуто три виміри 0,11; 0,12; 0,13 як помилкові. До розрахунку було подано 32 виміри. На основі найбільшого (Хмах = 0,10) і найменшого значення (Хmin = 0,03) підраховано ширину розподілу або поле розсіювання: ΔХ = Хмах – Хmin = 0,10 – 0,03 = 0,07.

Таблиця 1 – Результати вимірювання спостережень

0,07

0,05

0,05

0,06

0,06

0,08

0,08

0,03

0,07

0,06

0,08

0,06

0,06

0,07

0,05

0,03

0,07

0,07

0,08

0,07

0,10

0,08

0,08

0,06

0,05

0,04

0,07

0,10

0,06

0,07

0,04

0,07

0,11

0,12

0,13

Якщо кількість спостережень у виборці понад 20, то для систематизації та упорядкування вибірки весь діапазон значень розбивається на інтервали. Кількість інтервалів визначається за формулою:

k = 1 + 3,2lgn.

При виборі числа інтервалів кількість їх повинна бути не менше 67 при п = 30 .. 100 i не менше 915 при п > 100. Покладемо, що число інтервалів дорівнює к = 7. Тоді ціна інтервалу дорівнюватиме

Δх = ΔХ / k = 0,07 / 7 = 0,01.

Кількість значень ni, які потрапили в один із інтервалів, визначають частоту потрапляння в інтервал.

Упорядкований ряд середніх значень хi інтервалів зі зростанням називається статистичним рядом.

Графічне зображення статистичного ряду, координатами якого є частота інтервалу (вертикальна вісь y) і довжина інтервалу (горизонтальна вісь х), називається гістограмою.

Для побудови гістограми спочатку слід підрахувати частоти емпіричного розподілу за допомогою таблиці 2.

Таблица2 – Частоти емпіричного розподілу

Інтервали

Підрахунок частот позначками

Частота

Від

до

0,03

0,04

ІІ

2

0,04

0,05

ІІ

2

0,05

0,06

ІІІІ

4

0,06

0,07

ІІІІІІІ

7

0,07

0,08

ІІІІІІІІІ

9

0,08

0,09

ІІІІІІ

6

0,09

0,03

ІІ

2

Ліворуч вписуються інтервали від Хmin до (Хmin + с), від (Xmin + с) до (Хmin + 2с) i т.д. У кожен інтервал включаються розміри, що лежать у межах від найменшого значення інтервалу включно до найбільшого значення інтервалу, кpiм його. Праворуч за допомогою позначок роблять підрахунок числа спостережених poзмірів по інтервалах.

Почнемо будувати гістограму з масштабування осей. По горизонтальній осі встановимо точки відліку: 0,03 – 0,04; 0,04 – 0,05; 0,05 – 0,06; 0,06 – 0,07; 0,07 – 0,08; 0,08 – 0,09; 0,09 – 0,10, як зроблено на рис 1. Нехай тепер товщина вимірювального щупа буде у 10 разів тонша від тої, що була спочатку. У межах одного інтервала тепер розміститься у 10 разів більше вимірювань, а гістограма матиме більш плавну криву розподілу.

Рис. 1. Гістограма до прикладу 1

Приклад 2. Визначити основні статистичні характеристики вибіркової сукупності і побудувати гістограму для вибірки з 10 замірів твердості паперорізальних ножів: 61, 62, 65, 66, 65, 65, 67, 63, 63, 64.

Аналіз отриманих замірів свідчить, що мінімальне значення твердості хmin = 61, а максимальне значення хmax = 67. Кількість інтервалів повинна бути не менша від тої, що дає формула

K = l + 3,2lgN = 1 + 3,2lg10 = 4,2.

Приймемо кількість інтервалів К = 4. Всі інтервали вибірки Δх мають однакову ширину, яка обчислюється за формулою:

Δх = (хmaxxmin)/K = (67 – 61)/4 = 1,5.

Інтервал 6162,5 має два виміри, інтервал 62,564 (включно вимір 64) – три виміри, інтервал 6465,5 – три виміри, інтервал 65,567 – два виміри.

Середнє арифметичне значення  визначається за формулою:

= ()/N = (261,75 + 363,25 + 364,75 + 266,25)/10 = 64,

де  – середнє арифметичне значення на і-му інтервалі, і = 1, 2, 3, 4.

Вибіркова дисперсія S2, котра характеризує варіацію спостережень або змінність значень у виборці, визначається за формулою

S2 = ()/(N – 1) = (2(61,75 – 64)2 + 3(63,25 – 64)2 +

+ 30,5625 + 25,0625)/9 = 23,625/9 = 2,625,

де (n – 1) – число ступенів свободи, яке дорівнює щільності незалежних значень, що беруть участь у визначенні будь-якого параметра статистичної сукупності. У даному випадку одна ступінь свободи витрачається на визначення середнього значения, без якого неможливо визначити дисперсію.

Середнє квадратичне або стандартне відхилення від середнього значення дорівнює:

За наведеними даними побудуємо гістограму, яка приведена на рис. 1

Рис. 1. Гістограма розподілу кількості спостережень


 

А также другие работы, которые могут Вас заинтересовать

75607. Сигналы. Электрический сигнал в радиотехнике 390 KB
  Сигнал это информационная функция несущая сообщение о физических свойствах состоянии или поведении какойлибо физической системы объекта или среды а цель обработки сигналов извлечение сведений которые отображены в этих сигналах и преобразование этой информации в форму удобную для восприятия и использования. Для выявления общих свойств сигналов их классифицируют по ряду признаков рис. По возможности предсказания мгновенных значений сигналов в любые моменты времени различают сигналы детерминированные и случайные. Информативным...
75608. РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 259.5 KB
  Ортонормированный базис Для представления одномерных величин достаточно одного параметра. Возникает вопрос нельзя ли ввести ортонормированную систему в пространство функций так же как она вводится для векторного пространства Иначе говоря нельзя ли ввести множество взаимно перпендикулярных единичных функций Если это возможно то рассматриваемую функцию можно выразить в виде линейной комбинации таких функций. Рассмотрим некоторое множество функций семейство функций. Если число этих функций невелико можно...
75609. МАТЕМАТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СИГНАЛА. МЕТОДЫ ИССЛЕДОВАНИЯ ПОДОБИЯ СИГНАЛОВ. КОРРЕЛЯЦИЯ 136 KB
  Элемент из этого числового набора называется компонентом вектора. Это означает что анализ вектора f аналогичен анализу функции непрерывного сигнала ft если она не имеет точек разрыва. Для этого необходимо определить понятия: расстояния между векторами скалярное расстояние норма вектора...
75610. РАЗЛОЖЕНИЕ ФУНКЦИЙ В ДЕЙСТВИТЕЛЬНЫЙ РЯД ФУРЬЕ 282.5 KB
  В последнем соотношении колебание самого большого периода, представленное суммой cost и sint, называют колебанием основной частоты или первой гармоникой. Колебание с периодом, равным половине основного периода, называют второй гармоникой
75611. РАЗЛОЖЕНИЕ ФУНКЦИЙ В КОМПЛЕКСНЫЙ РЯД ФУРЬЕ 60.5 KB
  Это и есть разложение в комплексный ряд Фурье. Коэффициенты Сk называются комплексными коэффициентами Фурье и, подобно действительным коэффициентам Фурье, вычисляются как скалярные произведения
75612. КЛЮЧЕВЫЕ ОПЕРАЦИИ ЦОС 191 KB
  Применяется для вычисления выходного сигнала yt линейной системы по заданному входному xt и известному импульсному отклику ht рис. Линейными называются системы для которых справедлив принцип суперпозиции отклик на сумму входных сигналов равен сумме откликов на эти сигналы по отдельности и принцип однородности изменение амплитуды входного сигнала вызывает пропорциональное изменение амплитуды выходного сигнала. Для реальных систем объектов свойство линейности может выполняться приближенно В системах цифровой обработки...
75613. ПРОГРАММИРОВАНИЕ КЛЮЧЕВЫХ ОПЕРАЦИЙ ЦОС В MATLAB 51.5 KB
  Основные арифметические операции в MATLAB: сложение, вычитание, умножение , деление и возведение в степень. Операции умножения, деления и возведения в степень рассчитаны на работу с матрицами, поэтому при поэлементных операциях они записываются
75614. Цифровая фильтрация 152 KB
  согласованные фильтры; фильтры для борьбы с шумами при нелинейных и нестационарных процессах фильтр ГильбертаХуанга Выбор способа борьбы с шумами должен производится с учетом свойств и особенностей информативного сигнала и помехи. Чем в большей степени свойства сигнала и шума априори известны тем может быть получен больший эффект от цифровой обработки. Кроме того несмотря на обилие стандартных доведенных до уровня готовых программ цифровой обработки с учетом конкретных априори известных свойствах информативного сигнала и шума может...
75615. ОПТИМАЛЬНАЯ И СОГЛАСОВАННАЯ ФИЛЬТРАЦИЯ 170.5 KB
  Оптимальная фильтрация Оптимальное выделение сигнала из шума можно проводить различными методами в зависимости от того какая задача ставится: обнаружение сигнала сохранение формы сигнала и т. В каждом методе оптимальной фильтрации вводится понятие критерия оптимальности согласно которому строится оптимальный алгоритм обработки сигнала. Оптимальный фильтр КолмогороваВинера Фильтры низкой частоты высокой частоты и полосовые фильтры эффективны в том случае когда частотные спектры сигнала и шума не...