15710

ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ

Лекция

Математика и математический анализ

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ СПОСТЕРЕЖЕНЬ Модуль 1: ОСНОВНІ ПОЛОЖЕННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ Лекція 4: ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ План лекції 4: 4.1. Інтервальний ряд вибіркової статистичної сукупності. 4.2. Робота з гістограм...

Украинкский

2013-06-15

499.5 KB

21 чел.

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ

СПОСТЕРЕЖЕНЬ

Модуль 1: ОСНОВНІ ПОЛОЖЕННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ

Лекція 4: ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ

План лекції 4:

4.1. Інтервальний ряд вибіркової статистичної сукупності.

4.2. Робота з гістограмою розподілу кількості спостережень.

4.3. Діаграми Ейлера-Венна для пояснення властивостей подій.

4.1. Інтервальний ряд вибіркової статистичної сукупності.

Для первинної обробки експериментальних даних вибірки потрібні такі основні статистичні параметри: середнє арифметичне значення; вибіркова дисперсія; середнє квадратичне відхилення; коефіцієнт варіації; середня помилка середнього значення; показник точності досліду.

Якщо кількість спостережень N у вибірці понад 20, то задля упоряд-кування і систематизації вибірки весь діапазон значень розбивають на інтервали, сукупність яких складає іитервальний ряд.

Кількість інтервалів визначається за формулою:

K = 1 + 3,2lgN.

Усі інтервали вибірки приймаються однакової величини (довжини), яку знаходять за формулою:

y = (утах утіп)/K,

де утах та утіп – найбільше та найменше значення у вибірці.

Кількість значень пі, що потрапили в один із інтервалів, визначають частоту потрапляння в інтервал. Упорядкований ряд середніх значень інтервалів уі, що зростають, називається статистичним рядом. Графічне зображення статистичного ряду, координатами якого є частота інтервалу (вісь у) і довжина інтервалу (вісь х), називається гістограмою.

Приклад 1. Визначити основні статистичні параметри та побудувати гістограму вибірки з N = 10 замірів твердості паперорізальних ножів в одиницях HRC: 61, 62, 65, 66, 65, 65, 67, 63, 63, 64.

Аналіз отриманих замірів свідчить, що мінімальне значення твердості утin. = 61, а максимальне значення уmax = 67. Таким чином, діапазон спосте-режень являє собою відрізок [61, 67], довжина якого дорівнює 67 – 61 = 6.

Розібємо діапазон спостережень на відрізки (розряди) такої довжини, щоб кожний з них мав декілька експериментальніх даних. Можна, відрізок [61, 67] розділити на 6 або 4 частин. Довжина кожного розряду дорівнюва-тиме 1,0 або 1,5.

Для визначеності приймемо кількість інтервалів згідно формули:

К = 1 + 3,2lgN = 1 + 3,2 × lg10 = 1 + 3,2 × 1,0 = 4,2.

Округлимо кількість інтервалів К = 4. Величина інтервалу дорівнює: 

y = (6761) / 4 = 1,5.

Складемо таблицю 1 для визначення основних параметрів.

Таблиця 1

Номер інтер-валу

уін  –  уів

ni

уі cр

ni×уі cр

і cр - )2

ni×і cр - )2

1

61,0  62,5

2

61,75

123,5

5,0625

10,125

2

62,5 – 64,0

3

63,25

189,5

0,5625

1,6875

3

64,0 – 65,5

3

64,75

194,25

0,5625

1,6875

4

65,5 – 67,5

2

66,25

132,5

5,0625

10,125

Σ = 640

Σ = 23,625

Ycр = 64 

S2 = 2,625

Середнє значення вибірки = 64 і вибіркову дисперсію S2 = Σ/(n - 1) = = 23, 625 /9 = 2,625 визначаємо за відповідними формулами. На основі даних таблиці 1 будуємо гістограму, яка зображена на рис. 1.

Рис.1. Гістограма розподілу кількості спостережень

4.2. Робота з гістограмою розподілу кількості спостережень.

Однією з найбільш розповсюджених графічних форм представлення інформації є гістограма. Гістограма несе інформацію про те, як розподілені об'єкти на шкалі. Тому її часто називають просто розподілом об'єктів за ознакою. Для побудови гістограми область зміни ознак розбивають на ряд інтервалів, далі підраховують кількість об'єктів, які потрапили в кожний інтервал, і на його місці зображується стовпчик  відповідної висоти.

Чим більша кількість інтервалів, тим більш зазубреною буде гістограма, чим менше – тим більш гладкою, але при цьому можуть пропасти подробиці.

Форма гістограми та її характеристики несуть багату інформацію про структуру даних і розподіл об'єктів техніко-економічних даних. Чимало висновків і методів статистики ґрунтуються на використанні значень параметрів розподілів, особливо параметрів, що характеризують положення розподілу (координату його центру) і масштаб (розкид відносно центра).

Ці параметри можна не тільки кількісно оцінити за гістограмою, але й побачити їх. За гістограмою можна також оцінити функцію, яка описує розподіл, що також необхідно для використання низки статистичних методів.

Приступаючи до роботи з гістограмою, перш за все слід оцінити наявність групувань об'єктів. Якщо на гістограмі чітко проглядаються два-три «горби», то це означає наявність груп (рис. 2).

Рис. 2. Гістограма з «горбами»

Слід зауважити, що занадто поглиблений аналіз форми гістограми, особливо при незначній (менше 50) кількості об'єктів, може привести до невірних висновків, оскільки слабко виражені «пагорби і ями» можуть бути обумовлені не впливом групувань, а просто випадковими відхиленнями.

Якщо групування об'єктів не спостерігається, тобто є підстави вважати вибірку однорідною за деякою ознакою, то при подальшому аналізі корисними можуть бути простіші кількісні характеристики вибірки, які є оцінками параметрів теоретичного розподілу.

Більшість розподілів, котрі зустрічаються на практиці, мають дзвонопо-дібну функцію щільності розподілу (до неї наближається обвідна (огинаюча) гістограми при збільшенні числа об'єктів у вибірці), а частіше усього дослідники мають справу з нормальним, або гаусовим, розподілом.

Його параметрами є математичне сподівання М – координата центра і стандартне відхилення σхарактеристика розкиду (в інтервал ±2σ потрапляє 95,4% об'єктів сукупності, а в інтервал ±2σ потрапляє 99,7%).

Оцінками цих параметрів є середнє значення вибірки т і вибіркове середньоквадратичне відхилення S, котрі зазвичай обчислюються і виводяться на друк в програмах обробки даних.

Якщо гістограма приблизно симетрична, її «хвости» не надто довгі (не більше п'яти об'єктів на сто лежать за межами інтервалу ±2S), ними цілком можна користуватись. При різко асиметричній гістограмі (рис. 3) більш зручною характеристикою «центра» вибірки є медіана – координата точки, що поділяє вибірку навпіл (50% об'єктів зліва, 50% справа).

Рис. 3. Гістограма з «важким» або «довгим» хвостом.

Для симетричних розподілів медіана і математичне очікування співпадають, для несиметричних можуть дуже суттєво відрізнятись; відповідно відрізняються і їх оцінки. Медіана більш стійка ло різких викидів в даних, чим середнє арифметичне, що дозволяє використовувати її при роботі з розподілами, які мають хвости.

Аналіз «засміченості», «виявлення» помилок в даних і аналіз рідкісних спостережень, що виділяються, – ще одна задача, вирішенню якої допомагає розгляд гістограми.

«Підозрілі» об'єкти знаходяться на краях гістограми, на далекій відстані від основної її частини. Відповідні їм значення ознак треба перевіряти на всіхетапах – від зняття даних до їх введення в пам'ять ЕОМ.

Якщо «підозрілі» дані виникли «на законній підставі», то можливі два варіанти: виключити їх з розгляду, вважаючи нетиповими для отриманої вибірки, або залишити, врахувавши їх вплив.

На користь першого варіанта говорить те, що чимало даних дуже залежать від впливу умов спостережень (як кажуть, нестійкі), і, як наслідок, результати аналізу втрачають статистичну точність. Другий варіант означає, що факт появи «підозрілих» даних має місце і його потрібно проаналізувати і зрозуміти причину виникнення. З цієї точки зору викиди можуть бути навіть більш цікавими для аналізу, ніж інші дані.

Для аналізу «засмічених» вибірок даних застосовуються методи робастного (від англ. «robust» – стійкий, міцний) статистичного оцінювання, які дозволяють отримати стійкі оцінки параметрів розподілу. Дані методи дають змогу виконувати «підчистку» даних, котрі характеризуються спотвореними густинами (рос. плотностями) розподілів і тим самим призводять їх до певного параметричного вигляду.

4.3. Діаграми Ейлера-Венна для пояснення властивостей подій

Для наочного подання множини подій і глибшого розуміння суті і властивостей операцій над ними в алгебрі подій широко застосовується геометрична інтерпретація вказаних властивостей подій у вигдяді так званих діаграм Ейлера-Венна [1, c. 8 – 10; 3, c. 17 – 220].

Так, на рис. 4 події, обмежені квадратом, можна вважати базовою або універсальною множиною подій X. Тоді область, обмежена колом, є підмножиною подій А цієї універсальної множини Х.

Рис. 4. Підмножина подій А універсальної множини подій Х

При такій геометричній інтерпретації множин подій ті точки квадрата, які не належать підмножині А, тобто розміщуються поза кругом, в заштрихованій частині квадрата, являють собою доповнення Ā підмножини А до універсальної множини X.

Про доповнення множини подій Ā до множини подій А можна говорити тільки щодо відносно певної універсальної множини подій Х. На рис. 5 приведена геометрична інтерпретація об'єднання множин подій А і В, а на рис. 6 – перетину множин подій А і В.

Рис. 5. Інтерпретація обєднання підмножин подій А і В

Рис. 6. Інтерпретація перетину підмножин подій А і В

Множини подій, що створюються в результаті зазначених операцій, представлені заштрихованими областями в полі квадрата універсальної множини подій. Слід звернути увагу на те, що зовнішня щодо результатів відповідних подій, тобто незаштрихована частина квадрата, є доповнення  до об'єднання AUВ множин подій А і В на рис. 5 і доповнення  до їх перетину АВ множин подій на рис. 6.

За допомогою діаграм Ейлера-Венна можна ввести ще дві операції над множинами подій, результатами яких є відповідно поняття різниці множин подій А і В та їх диз'юнктивної суми.

Визначення 18. Якщо В Ì A, то різницею множин подій А і В називається множина подій С=А\В, яка складається з усіх елементів множини подій А, що не належать множині подій В. Поняття різниці подій легко усвідомити за допомогою рис. 7, на якому події, приналежні різниці подій С=А\В, мають вигляд заштрихованої областї.

Рис. 7. Геометрична інтерпретація різниці А\В подій А і В

Визначення 19. Диз'юнктивною сумою подій А і В прийнято називати множину подій, що належать або виключно множині А, або виключно множині В. Дана операція зазвичай позначається формулою S = А Å В.

За допомогою геометричної інтерпретації цієї операції шляхом використання діаграм Ейлера-Венна неважко переконатися в тому, що

.

На рис. 8 вертикальна штриховка визначає область , а похилі лінії визначають область .

Рис. 1.8. Інтерпретація дизюнктивної суми множин подій

Таким чином, та частина площі квадрата, яка заштрихована двома способами, і є областю, що належить диз'юнктивній сумі множин А і В, тобто ця сума дійсно дорівнює

S = .

Операція диз'юнктивної суми множин подій володіє численними властивостями. Зокрема, для неї справедливі наступні співвідношення:

А Å В = В Å А,

що відображає властивість комутативності диз'юнктивної суми;

Å В) Å С = A Å (BÅ C),

що відображає властивість асоціативності диз'юнктивної суми;

А Å Æ = Æ Å А,

що відображає існування нейтрального елементу для диз'юнктивної суми; таким нульовим елементом виступає порожня множина Æ.

Висновки

В лекції 4 розглянуто графічне подання числової інформації, представленої інтервальним рядом вибіркової статистичної сукупності, приведено приклади побудови гістограми розподілу спостережень та діаграм Ейлера-Венна для пояснення властивостей подій.

Завдання і питання для самоперевірки

1. Привести означення операції обєднання подій і пояснити її сенс за допомогою діаграми Ейлера Венна.

2. Привести означення операції перетину подій і пояснити її сенс за допомогою діаграми Ейлера-Венна.

3. Привести означення порожньої події і розкрити їїсутність.

4. У чому полягають переваги використання діаграм Ейлера-Венна при вивченні операцій над подіями?

Літературні джерела:

1. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных. – М.: Финансы и статистика, 1983. – 471 с.

2. Сигел Э.Ф. Практическая бизнес-статистика. – М.: Вильямс, 2002. – 1056 с.

3. Мельник В.М. Тринадцять лекцій з теорії ймовірностей: Текст лекцій / В.М. Мельник, О.П. Созник. – Х.: Акад. ВВ МВС України, 2008. – 112 с.

4. Пономарев А.С. Нечеткие множества в задачах автоматизированного управления и принятия решений: Навчальний посібник. – Харків: НТУ «ХПІ», 2005. – 232 с.

5. Игуменцева Н.В., Пахомов В.И. Статистический анализ результатов наблюдений: Учебное пособие. – Харьков: СМИТ, 2005. – 236 с.


 

А также другие работы, которые могут Вас заинтересовать

51871. Первая медицинская помощь при черепно-мозговой травме, травме груди, живота, области таза, и наступлении травматического шока 266 KB
  Первая медицинская помощь при черепномозговой травме травме груди живота области таза и наступлении травматического шока. Основные факторы вызывающие данный вид шока сильное болевое раздражение и потеря больших объёмов крови. Симптомы Травматического шока: Травматический шок обычно проходит в своём развитии две фазы так называемую эректильную фазу шока и торпидную фазу. У больных с низкими компенсаторными возможностями организма эректильная фаза шока может отсутствовать или быть очень короткой измеряться минутами и шок...
51872. Причины аварий на химически опасных объектах. Последствия аварий на химически опасных объектах. Очаг химического поражения. Зоны химического заражения 112.5 KB
  Причины аварий на химически опасных объектах. Последствия аварий на химически опасных объектах. Цель урока: рассмотреть основные причины и последствия аварий на химически опасных объектах.Хренников 8 класс; презентация; рекомендации специалистов МЧС России по правилам безопасного поведения при химических авариях.
51874. ВИБІРКОВИЙ ПЕРЕКАЗ РОЗПОВІДНОГО ТЕКСТУ З ЕЛЕМЕНТАМИ ОПИСУ ПАМ’ЯТКИ ІСТОРІЇ ТА КУЛЬТУРИ В НАУКОВОМУ СТИЛІ 61 KB
  Растреллі на Андріївській горі в память відвідин Києва імператрицею Єлизаветою Петрівною на місці Хрестовоздвиженської церкви. Висота церкви з хрестом 46 м зі стилобатом 60 м; довжина 30 м ширина 23 м. Уся маса церкви спирається на двоповерховий будинокстилобат з 8 кімнатами на кожному поверсі стіни якого являють собою фундаменти церкви. Навколо церкви балюстрада з якої відкривається мальовнича панорама Подолу й Дніпра.