15716

ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН

Лекция

Математика и математический анализ

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ СПОСТЕРЕЖЕНЬ Модуль 2: ОСНОВНІ ХАРАКТЕРИСТИКИ ОБРОБЛЕННЯ ДАНИХ Лекція 10. ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН План лекції 7: 10.1. Щільність ймовірності випадкових величин 10.2. Числові характеристики випадкови

Украинкский

2013-06-15

1.22 MB

5 чел.

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ

СПОСТЕРЕЖЕНЬ

Модуль 2: ОСНОВНІ ХАРАКТЕРИСТИКИ ОБРОБЛЕННЯ ДАНИХ

Лекція 10. ГІСТОГРАМИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН

План лекції 7:

10.1. Щільність ймовірності випадкових величин

10.2. Числові характеристики випадкових величин

10.3. Гістограми розподілу випадкових величин

10.1. Щільність ймовірності випадкових величин

Випадковою величиною називається змінна, яка приймає своє чисельне (рос. численное) значення залежно від результату випадкового експерименту. Якщо результатом випробування є вимірювання фізичної величини, то її вважа-ють випадковою величиною, а виміряне значення є її чисельним значенням.

Випадкова величина х може бути дискретною або неперервною. Наприклад, випадкова величина, пов’язана з підкиданням гральної кості, вважається дискретною з результатом у вигляді цілих чисел від 1 до 6, тоді як проміжки часу між надходженням замовлень в систему обслуговування вважаються неперервною випадковою величиною з додатними значеннями.

Як неперервна, так і дискретна випадкова величина має щільність розподілу ймовірностей, яку часто називають просто щільність ймовірності і позначають як f(x) (для неперервної випадкової величини) або р(х) (для дискретної випадкової величини). Щільності ймовірностей повинні задовольняти умовам  невід’ємності:

р(х) ≥ 0 (для дискретної випадкової величини),

f(x) ≥ 0 (для неперервної випадкової величини)

та умовам нормування:

для дискретної випадкової величини,

для неперервної випадкової величини.

Умова невід’ємності для неперервних та дискретних розподілень означає, що щільність ймовірності не може приймати від’ємні значення (у протилежному випадку ймовірність деяких подій могла б бути від’ємною). Умова нормування свідчить про те, що сума ймовірностей по усьому простору подій повинна дорівнювати одиниці.

Найважливішею імовірнісною характеристикою випадкової величини є функція розподілення, яка визначається таким чином:

Р{xX} =  для дискретної випадкової величини,

Р{xX} = для неперервної випадкової величини.

Приклад 1. Розглянемо випадок з підкиданням гральної кості. Результат гри може приймати шість різних значень x = {1, 2, 3, 4, 5, 6}, де х – випадкова величина, що приймає шість різних цілих значень з однаковими ймовірно-стями, котрі дорівнюють 1/6. Цю випадкову величину x подамо таблицею 1:

Таблиця 1 –  Вихідні дані для побудови закону розподілу

Х

1

2

3

4

5

6

р(х)

1/6

1/6

1/6

1/6

1/6

1/6

Така таблиця називається законом розподілення ймовірностей дискрет-ної випадкової величини, котрий надає повну інформацію про цю величину. У верхньому рядку зазначено усі можливі чисельні значення, а у нижній – відповідні їм ймовірності.

Щільність ймовірності і функція розподілу ймовірності випадкової величини х визначаються відповідно таким чином:

, х = 1, 2, 3, 4, 5, 6 щільність ймовірності,

, Х = 1, 2, 3, 4, 5, 6.

Графіки цих двох функцій приведені на рис. 1. Щільність ймовірності р(х) являє собою рівномірну дискретну функцію, оскільки будь-які значення випадкової величини сприймаються з однаковими ймовірностями.

Дискретний розподіл може мати безкінечну кількість можливих значень, проте ця множина значень повинна бути зчисленною. В силу умови нормування значення ймовірностей у цьому випадку повинні становитися безкінечно малими.

Рис. 1. Дискретний рівномірний закон розподілу  

Неперервною випадковою величиною називається величина, котра може приймати будь-яке значення із заданого скінченого числового іинтервалу. Інакше кажучи, неперервна випадкова величина завжди приймає незчислену множину значень, а ймовірність того, що вона прийме у точності будь-яке задане значення, дорівнює нулю.

Тому для неперервної випадкової величини має сенс говорити тільки про ймовірність попасти в деякий числовий інтервал. Якщо взяти безкінечно малий інтервал від х до х + dx, то й імовірність dp попасти в нього буде безкінечно малою, а тому її можна вважати пропорційною dx, тобто

dp = p(x<X<dx) = f(x)dx,

де коефіцієнт пропорційності f(x) залежить від х і являє собою щільність ймовірності (або щільність розподілу).

Ймовірність випадкової величини Х попасти в скінчений інтервал (х1, х2) дорівнює

P(xl<X<x2) =.

Умова нормування неперервної випадкової величини має такий вигляд

= 1.

Функція щільності ймовірності не може бути відємною. Для виконання умови нормування вона повинна зникати на нескінченості.

В якості первісної функції F(x) для f(x) беруть функцію

F(x) =,

яка монотоно зростає від 0 до 1 і має простий імовірнісний сенс F(x)=Р(- <X< х). Таку функцію называють функцією розподілу неперервної випадкової величини.

Таким чином, для задання дискретної випадкової величини слід задати закон розподілення у вигдяді таблиці, а для задання неперервної випадкової величини слід задати щільність ймовірності f(х) або функцію розподілу F(x).

Приклад 2. Припустимо, що рівномірна щільність ймовірності f(x) неперервної випадкової величини х визначається співвідношенням:

, 0 ≤ х ≤ πl.

Тоді функція розподілу F(X) випадкової величини х обчислюється за формулою:

F(X) = Р{ xX } = , 0 ≤ Х ≤ πl.

Графіки щільності ймовірності f(x) та функції розподілення F(X) представлені на рис. 2.

Рис. 2. Щільність ймовірності  f(x) і функція розподілення F(x)

10.2. Числові характеристики випадкових величин

Для загальної характеристики властивостей одновимірної випадкової величини х використовуються дві числові характеристики: математичне сподівання (середнє значення) М{x} і дисперсія D{x}. Математичне сподівання визначає характеристику положення розподілу випадкової величини х на числовій осі відносно початку координат, а дисперсія є мірою її розкиду відносно математичного сподівання М{x}. Велике значення дисперсії свідчить про високий ступінь невизначеності в описанні випадкової змінної.

При заданій щільності ймовірності (р(х) або f(x) для дискретної або неперервної випадкової величини відповідно) величина математичного сподівання М{x} обчислюється за формулами:

М{x} =  для дискретної випадкової величини,

М{x} = для неперервної випадкової величини.

Дисперсія випадкової величини D{x} характеризує ступінь розсіювання довкола М{x} і дорівнює математичному сподіванню квадрата відхилення від М{x}, тобто

D{x} =М[(xМ{x})2]

або

D{x} = для дискретної випадкової величини,

D{x} = для неперервної випадкової величини.

Обґрунтованість висновку зазначених формул легше проглядається для дискретного розподілу. В цьому випадку М{x} представляє собою зважену суму дискретних значень х, D{x} – взважену суму квадратів відхилень випадкової величини х від М{x}. Випадок з неперервно розподіленою випадковою величиною можна інтерпретувати аналогічно, замінивши операцію інтегрування операцією підсумовуванням.

Дисперсія має вимірність квадрата вимірності випадкової величини. Тому вводять поняття середнього квадратичного відхилення σ(х) випадкової величини, яке дорівнює кореню квадратичному від дисперсії:

σ(х) = .

Крім математичного сподівання і середнього квадратичного відхилення, використовують й інші числові характеристики випадкових величин. Модою розподілення Мо(х) називають таке значення дискретної випадкової величины, для якої ймовірність максимальна. Для неперервної випадкової величини модою називають те значения х, для якого функція щільності ймовірності має максимум. Якщо мода одна, то розподілення  називається унімодальним, якщо декілька — мультимодальним.

Для неперервних розподілень використовують так звані квантилі, котрі представляють собою ті значення випадкової величини, які відділяють інтервали однакової ймовірності. Серед квантилів виокремлюють медіану 0,5х; квартилі  0,25x; 0,5х; 0,75х; децилі  0,1х; 0,2х; 0,4х; процентилі  0,01х, 0,02х, …, 0,99х. Очевидно, що

Р(Х < 0,05х) = Р(Х > 0,5х)  =  0,5  –  медіана,

Р(Х < 0,25х) = Р(Х> 0,75х) = 0,25  –  квартиль.

Для характеристики асиметрії (бокової скривленості) розподілу використо-вується коефіцієнт асиметрії

С3 = М(хМ(х))33(х).

Для характеристики вертикальної приплюснутості розподілу викорис-товується ексцес

Е = [М(хМ(х))4/σ 4(х)]3,

котрий показує відхилення існуючого розподілу від нормального, для якого функцією щільності ймовірності послуговує функция Гаусса.

Використовуються також такі числові характеристики випадкових величин, як коефіцієнт варіації  σ/М(х) та розмах мах Хmin).

Приклад 1. Знайти середнє арифметичне чисел х1, х2,   , хn для даних, приведених в таблиці 1

Таблиця 1

І

1

2

3

4

5

6

7

8

9

10

хі

25

30

22

22

54

36

41

47

25

40

за формулою

= (х1 + х2 + х3 + х4 + х5 + х6 + х7 + х8 + х9 + х10)/10 =

= (25 + 30 + 22 + 22 + 54 + 36 + 41 + 47 + 25 + 40)/10 = 34.

Знайти дисперсію чисел х1, х2,   , хn для даних таблиці 2 за формулою

Таблиця 2

і

1

2

3

4

5

6

7

8

9

10

Σ

хі

25

30

22

22

54

36

41

45

25

40

340

хі-

-9

-4

-12

-12

20

2

7

11

-9

6

0

(хі-)2

81

16

144

144

400

4

49

121

81

36

1076

D = [(х1  )2 + (х2  )2 + … + 10  )2]/10 =

= [(25  34)2 + (30  34)2 + … + (40  34)2]/10 = 107,6.

Вичислити середнє квадратичне відхилення величин х1, х2, … , х10 від їх середнього значення за формулою

Дисперсію можна тлумачити як середню арифметичну квадратів різниць (х1  ), (х2  ), … (хn  ).

10.3. Гістограми розподілу випадкових величин

Вимірюючи деяку величину багато разів, ми отримуємо кожен відлік у вигляді певного дискретного значення. Ці значення можуть збігатися, можуть знаходитися близько одне до одного або далеко. Побачити, як часто ми одержували те або інше значення, зовсім не важко. Для цього достатньо побудувати гістограму, яка графічно відображає густоту розподілу ймовірностей випадкової величини.

Приклад 1. На кораблях типу «Фізик Вавілов» вал прокладається на підшипниках кочення діаметром 700 мм. Перед навішуванням на судовий вал у підшипників перевіряється зазор прибором з ціною розподілу 00,1. Результати вимірювання представлені в таблиці 1 як відхилення від номінального значення діаметра в міліметрах.

З 35 виконаних вимірів відкинуто три виміри 0,11; 0,12; 0,13 як помилкові. До розрахунку було подано 32 виміри. На основі найбільшого (Хмах = 0,10) і найменшого значення (Хmin = 0,03) підраховано ширину розподілу або поле розсіювання: ΔХ = Хмах – Хmin = 0,10 – 0,03 = 0,07.

Таблиця 1 – Результати вимірювання спостережень

0,07

0,05

0,05

0,06

0,06

0,08

0,08

0,03

0,07

0,06

0,08

0,06

0,06

0,07

0,05

0,03

0,07

0,07

0,08

0,07

0,10

0,08

0,08

0,06

0,05

0,04

0,07

0,10

0,06

0,07

0,04

0,07

0,11

0,12

0,13

Якщо кількість спостережень у виборці понад 20, то для систематизації та упорядкування вибірки весь діапазон значень розбивається на інтервали. Кількість інтервалів визначається за формулою:

k = 1 + 3,2lgn.

При виборі числа інтервалів кількість їх повинна бути не менше 67 при п = 30 .. 100 i не менше 915 при п > 100. Покладемо, що число інтервалів дорівнює к = 7. Тоді ціна інтервалу дорівнюватиме

Δх = ΔХ / k = 0,07 / 7 = 0,01.

Кількість значень ni, які потрапили в один із інтервалів, визначають частоту потрапляння в інтервал.

Упорядкований ряд середніх значень хi інтервалів зі зростанням називається статистичним рядом.

Графічне зображення статистичного ряду, координатами якого є частота інтервалу (вертикальна вісь y) і довжина інтервалу (горизонтальна вісь х), називається гістограмою.

Для побудови гістограми спочатку слід підрахувати частоти емпіричного розподілу за допомогою таблиці 2.

Таблица2 – Частоти емпіричного розподілу

Інтервали

Підрахунок частот позначками

Частота

Від

до

0,03

0,04

ІІ

2

0,04

0,05

ІІ

2

0,05

0,06

ІІІІ

4

0,06

0,07

ІІІІІІІ

7

0,07

0,08

ІІІІІІІІІ

9

0,08

0,09

ІІІІІІ

6

0,09

0,03

ІІ

2

Ліворуч вписуються інтервали від Хmin до (Хmin + с), від (Xmin + с) до (Хmin + 2с) i т.д. У кожен інтервал включаються розміри, що лежать у межах від найменшого значення інтервалу включно до найбільшого значення інтервалу, кpiм його. Праворуч за допомогою позначок роблять підрахунок числа спостережених poзмірів по інтервалах.

Почнемо будувати гістограму з масштабування осей. По горизонтальній осі встановимо точки відліку: 0,03 – 0,04; 0,04 – 0,05; 0,05 – 0,06; 0,06 – 0,07; 0,07 – 0,08; 0,08 – 0,09; 0,09 – 0,10, як зроблено на рис 1. Нехай тепер товщина вимірювального щупа буде у 10 разів тонша від тої, що була спочатку. У межах одного інтервала тепер розміститься у 10 разів більше вимірювань, а гістограма матиме більш плавну криву розподілу.

Рис. 1. Гістограма до прикладу 1

Приклад 2. Визначити основні статистичні характеристики вибіркової сукупності і побудувати гістограму для вибірки з 10 замірів твердості паперорізальних ножів: 61, 62, 65, 66, 65, 65, 67, 63, 63, 64.

Аналіз отриманих замірів свідчить, що мінімальне значення твердості хmin = 61, а максимальне значення хmax = 67. Кількість інтервалів повинна бути не менша від тої, що дає формула

K = l + 3,2lgN = 1 + 3,2lg10 = 4,2.

Приймемо кількість інтервалів К = 4. Всі інтервали вибірки Δх мають однакову ширину, яка обчислюється за формулою:

Δх = (хmaxxmin)/K = (67 – 61)/4 = 1,5.

Інтервал 6162,5 має два виміри, інтервал 62,564 (включно вимір 64) – три виміри, інтервал 6465,5 – три виміри, інтервал 65,567 – два виміри.

Середнє арифметичне значення  визначається за формулою:

= ()/N = (261,75 + 363,25 + 364,75 + 266,25)/10 = 64,

де  – середнє арифметичне значення на і-му інтервалі, і = 1, 2, 3, 4.

Вибіркова дисперсія S2, котра характеризує варіацію спостережень або змінність значень у виборці, визначається за формулою

S2 = ()/(N – 1) = (2(61,75 – 64)2 + 3(63,25 – 64)2 +

+ 30,5625 + 25,0625)/9 = 23,625/9 = 2,625,

де (n – 1) – число ступенів свободи, яке дорівнює щільності незалежних значень, що беруть участь у визначенні будь-якого параметра статистичної сукупності. У даному випадку одна ступінь свободи витрачається на визначення середнього значения, без якого неможливо визначити дисперсію.

Середнє квадратичне або стандартне відхилення від середнього значення дорівнює:

За наведеними даними побудуємо гістограму, яка приведена на рис. 1

Рис. 1. Гістограма розподілу кількості спостережень


 

А также другие работы, которые могут Вас заинтересовать

33256. Вопросы по менеджменту (Госы) 789.28 KB
  Демократизация управления путь повышения эффективности организации. Характеристика основных функций управления. Постановка вопроса о методах управления. Характеристика методов управления.
33257. Экономические и социальные критерии эффективности управленческих решений 82 KB
  Зависит от стоимости рабочей силы и цены товара Частота производственного травматизма Отношение числа случаев производственного травматизма к общей численности персонала Характеризует состояние охраны труда и техники безопасности Фиксирует только явные случаи производственного травматизма.дни Отношение суммарных потерь времени изза болезни простоев и неявок к общей численности персонала Показывает резервы эффективности в использовании труда персонала Не фиксирует внутрисменные потери рабочего...
33258. Организационные структуры управления 131 KB
  Организационная структура это состав и соподчиненность взаимосвязанных звеньев управления. Организационная структура управления состоит из совокупности взаимосвязанных звеньев управления. Звено управления самостоятельная часть организационной структуры на определенной ступени уровне состоящая из аппарата управления и производственных подразделений.
33259. Социально-психологические методы управления 59.5 KB
  Лидерство и власть. Лидеры используют власть как средство в достижении целей группы или организации. Если лидеры достигают цели то власть как средство Используется ими для ускорения этого достижения. В чем же различие между лидерством и властью Важное различие относится к совместимости целей.
33260. Характеристика основных правовых форм организации 114 KB
  Характеристика органов управления ИЧП показана в табл. Характеристика органов управления индивидуальным и семейным частным предприятием Наименование органов управления Численность и сроки избрания Кто формирует Основные функции Кого назначает избирает Владелец собственник предприятия законодательный орган ИЧП 1 человек до ликвидации предприятия Владелец учредитель предприятия Принятие и утверждение устава определение уставного фонда утверждение планов и отчетов стратегия развития предприятия создание и ликвидация предприятия...
33261. Функционирование организации: понятие, и этапы жизненного цикла организации. Управление развитием организацией 52 KB
  Управление развитием организацией В менеджменте широко распространено понятие жизненного цикла организации под которым понимаются ее предсказуемые изменения с определенной последовательностью состояний в течение времени. Один из вариантов жизненного цикла организации на соответствующем временном отрезке предусматривает следующие этапы представленные на рис. Развиваются инновационные процессы предыдущего этапа формируется миссия организации.
33262. Сущность, задачи, особенности стратегического менеджмента 38.5 KB
  Методы стратегического менеджмента: метод системного подхода метод стратегической диагностики метод экспертных оценок метод стратегического анализа метод экономической и математической статистики Объект СМ фирма как открытая система Процесс стратегического планирования является инструментом который помогает руководству фирмы принимать правильные стратегические решения и корректировать в соответствии с ними повседневную жизнь организации. Схема стратегического планирования состоит из этапов: Преднамеренная стратегия называемая...
33263. ПРОЦЕСС РАЗРАБОТКИ СТРАТЕГИИ 76.5 KB
  СТЕПанализ Социодемографические воздействия Анализ социального окружения затрагивает вопросы связанные с пониманием роли общества и социальных перемен в жизни организации ее отрасли и рынков. Оно выступает в роли собственника или влияет на национализированные отрасли производства. Правительства некоторых стран контролируют ключевые стратегические отрасли причем способы контроля могут иметь эффект толчка резонанса в других экономических районах страны; международная политика. Анализ конкурентного окружения Отрасли и рынки Отрасли...
33264. Стратегия лидерства по издержкам 64.5 KB
  Существуют четыре широкие альтернативы: проникновение на рынок увеличение рыночной доли на старых рынках с помощью существующей продукции; освоение рынка внедрение на новые рынки и новые сегменты рынка с помощью существующей продукции; разработка продукта разработка новой продукции для обслуживания старых рынков; диверсификация разработка новых продуктов для обслуживания новых рынков. Продуты Существующие Новые...