15710

ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ

Лекция

Математика и математический анализ

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ СПОСТЕРЕЖЕНЬ Модуль 1: ОСНОВНІ ПОЛОЖЕННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ Лекція 4: ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ План лекції 4: 4.1. Інтервальний ряд вибіркової статистичної сукупності. 4.2. Робота з гістограм...

Украинкский

2013-06-15

499.5 KB

21 чел.

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ

СПОСТЕРЕЖЕНЬ

Модуль 1: ОСНОВНІ ПОЛОЖЕННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ

Лекція 4: ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ

План лекції 4:

4.1. Інтервальний ряд вибіркової статистичної сукупності.

4.2. Робота з гістограмою розподілу кількості спостережень.

4.3. Діаграми Ейлера-Венна для пояснення властивостей подій.

4.1. Інтервальний ряд вибіркової статистичної сукупності.

Для первинної обробки експериментальних даних вибірки потрібні такі основні статистичні параметри: середнє арифметичне значення; вибіркова дисперсія; середнє квадратичне відхилення; коефіцієнт варіації; середня помилка середнього значення; показник точності досліду.

Якщо кількість спостережень N у вибірці понад 20, то задля упоряд-кування і систематизації вибірки весь діапазон значень розбивають на інтервали, сукупність яких складає іитервальний ряд.

Кількість інтервалів визначається за формулою:

K = 1 + 3,2lgN.

Усі інтервали вибірки приймаються однакової величини (довжини), яку знаходять за формулою:

y = (утах утіп)/K,

де утах та утіп – найбільше та найменше значення у вибірці.

Кількість значень пі, що потрапили в один із інтервалів, визначають частоту потрапляння в інтервал. Упорядкований ряд середніх значень інтервалів уі, що зростають, називається статистичним рядом. Графічне зображення статистичного ряду, координатами якого є частота інтервалу (вісь у) і довжина інтервалу (вісь х), називається гістограмою.

Приклад 1. Визначити основні статистичні параметри та побудувати гістограму вибірки з N = 10 замірів твердості паперорізальних ножів в одиницях HRC: 61, 62, 65, 66, 65, 65, 67, 63, 63, 64.

Аналіз отриманих замірів свідчить, що мінімальне значення твердості утin. = 61, а максимальне значення уmax = 67. Таким чином, діапазон спосте-режень являє собою відрізок [61, 67], довжина якого дорівнює 67 – 61 = 6.

Розібємо діапазон спостережень на відрізки (розряди) такої довжини, щоб кожний з них мав декілька експериментальніх даних. Можна, відрізок [61, 67] розділити на 6 або 4 частин. Довжина кожного розряду дорівнюва-тиме 1,0 або 1,5.

Для визначеності приймемо кількість інтервалів згідно формули:

К = 1 + 3,2lgN = 1 + 3,2 × lg10 = 1 + 3,2 × 1,0 = 4,2.

Округлимо кількість інтервалів К = 4. Величина інтервалу дорівнює: 

y = (6761) / 4 = 1,5.

Складемо таблицю 1 для визначення основних параметрів.

Таблиця 1

Номер інтер-валу

уін  –  уів

ni

уі cр

ni×уі cр

і cр - )2

ni×і cр - )2

1

61,0  62,5

2

61,75

123,5

5,0625

10,125

2

62,5 – 64,0

3

63,25

189,5

0,5625

1,6875

3

64,0 – 65,5

3

64,75

194,25

0,5625

1,6875

4

65,5 – 67,5

2

66,25

132,5

5,0625

10,125

Σ = 640

Σ = 23,625

Ycр = 64 

S2 = 2,625

Середнє значення вибірки = 64 і вибіркову дисперсію S2 = Σ/(n - 1) = = 23, 625 /9 = 2,625 визначаємо за відповідними формулами. На основі даних таблиці 1 будуємо гістограму, яка зображена на рис. 1.

Рис.1. Гістограма розподілу кількості спостережень

4.2. Робота з гістограмою розподілу кількості спостережень.

Однією з найбільш розповсюджених графічних форм представлення інформації є гістограма. Гістограма несе інформацію про те, як розподілені об'єкти на шкалі. Тому її часто називають просто розподілом об'єктів за ознакою. Для побудови гістограми область зміни ознак розбивають на ряд інтервалів, далі підраховують кількість об'єктів, які потрапили в кожний інтервал, і на його місці зображується стовпчик  відповідної висоти.

Чим більша кількість інтервалів, тим більш зазубреною буде гістограма, чим менше – тим більш гладкою, але при цьому можуть пропасти подробиці.

Форма гістограми та її характеристики несуть багату інформацію про структуру даних і розподіл об'єктів техніко-економічних даних. Чимало висновків і методів статистики ґрунтуються на використанні значень параметрів розподілів, особливо параметрів, що характеризують положення розподілу (координату його центру) і масштаб (розкид відносно центра).

Ці параметри можна не тільки кількісно оцінити за гістограмою, але й побачити їх. За гістограмою можна також оцінити функцію, яка описує розподіл, що також необхідно для використання низки статистичних методів.

Приступаючи до роботи з гістограмою, перш за все слід оцінити наявність групувань об'єктів. Якщо на гістограмі чітко проглядаються два-три «горби», то це означає наявність груп (рис. 2).

Рис. 2. Гістограма з «горбами»

Слід зауважити, що занадто поглиблений аналіз форми гістограми, особливо при незначній (менше 50) кількості об'єктів, може привести до невірних висновків, оскільки слабко виражені «пагорби і ями» можуть бути обумовлені не впливом групувань, а просто випадковими відхиленнями.

Якщо групування об'єктів не спостерігається, тобто є підстави вважати вибірку однорідною за деякою ознакою, то при подальшому аналізі корисними можуть бути простіші кількісні характеристики вибірки, які є оцінками параметрів теоретичного розподілу.

Більшість розподілів, котрі зустрічаються на практиці, мають дзвонопо-дібну функцію щільності розподілу (до неї наближається обвідна (огинаюча) гістограми при збільшенні числа об'єктів у вибірці), а частіше усього дослідники мають справу з нормальним, або гаусовим, розподілом.

Його параметрами є математичне сподівання М – координата центра і стандартне відхилення σхарактеристика розкиду (в інтервал ±2σ потрапляє 95,4% об'єктів сукупності, а в інтервал ±2σ потрапляє 99,7%).

Оцінками цих параметрів є середнє значення вибірки т і вибіркове середньоквадратичне відхилення S, котрі зазвичай обчислюються і виводяться на друк в програмах обробки даних.

Якщо гістограма приблизно симетрична, її «хвости» не надто довгі (не більше п'яти об'єктів на сто лежать за межами інтервалу ±2S), ними цілком можна користуватись. При різко асиметричній гістограмі (рис. 3) більш зручною характеристикою «центра» вибірки є медіана – координата точки, що поділяє вибірку навпіл (50% об'єктів зліва, 50% справа).

Рис. 3. Гістограма з «важким» або «довгим» хвостом.

Для симетричних розподілів медіана і математичне очікування співпадають, для несиметричних можуть дуже суттєво відрізнятись; відповідно відрізняються і їх оцінки. Медіана більш стійка ло різких викидів в даних, чим середнє арифметичне, що дозволяє використовувати її при роботі з розподілами, які мають хвости.

Аналіз «засміченості», «виявлення» помилок в даних і аналіз рідкісних спостережень, що виділяються, – ще одна задача, вирішенню якої допомагає розгляд гістограми.

«Підозрілі» об'єкти знаходяться на краях гістограми, на далекій відстані від основної її частини. Відповідні їм значення ознак треба перевіряти на всіхетапах – від зняття даних до їх введення в пам'ять ЕОМ.

Якщо «підозрілі» дані виникли «на законній підставі», то можливі два варіанти: виключити їх з розгляду, вважаючи нетиповими для отриманої вибірки, або залишити, врахувавши їх вплив.

На користь першого варіанта говорить те, що чимало даних дуже залежать від впливу умов спостережень (як кажуть, нестійкі), і, як наслідок, результати аналізу втрачають статистичну точність. Другий варіант означає, що факт появи «підозрілих» даних має місце і його потрібно проаналізувати і зрозуміти причину виникнення. З цієї точки зору викиди можуть бути навіть більш цікавими для аналізу, ніж інші дані.

Для аналізу «засмічених» вибірок даних застосовуються методи робастного (від англ. «robust» – стійкий, міцний) статистичного оцінювання, які дозволяють отримати стійкі оцінки параметрів розподілу. Дані методи дають змогу виконувати «підчистку» даних, котрі характеризуються спотвореними густинами (рос. плотностями) розподілів і тим самим призводять їх до певного параметричного вигляду.

4.3. Діаграми Ейлера-Венна для пояснення властивостей подій

Для наочного подання множини подій і глибшого розуміння суті і властивостей операцій над ними в алгебрі подій широко застосовується геометрична інтерпретація вказаних властивостей подій у вигдяді так званих діаграм Ейлера-Венна [1, c. 8 – 10; 3, c. 17 – 220].

Так, на рис. 4 події, обмежені квадратом, можна вважати базовою або універсальною множиною подій X. Тоді область, обмежена колом, є підмножиною подій А цієї універсальної множини Х.

Рис. 4. Підмножина подій А універсальної множини подій Х

При такій геометричній інтерпретації множин подій ті точки квадрата, які не належать підмножині А, тобто розміщуються поза кругом, в заштрихованій частині квадрата, являють собою доповнення Ā підмножини А до універсальної множини X.

Про доповнення множини подій Ā до множини подій А можна говорити тільки щодо відносно певної універсальної множини подій Х. На рис. 5 приведена геометрична інтерпретація об'єднання множин подій А і В, а на рис. 6 – перетину множин подій А і В.

Рис. 5. Інтерпретація обєднання підмножин подій А і В

Рис. 6. Інтерпретація перетину підмножин подій А і В

Множини подій, що створюються в результаті зазначених операцій, представлені заштрихованими областями в полі квадрата універсальної множини подій. Слід звернути увагу на те, що зовнішня щодо результатів відповідних подій, тобто незаштрихована частина квадрата, є доповнення  до об'єднання AUВ множин подій А і В на рис. 5 і доповнення  до їх перетину АВ множин подій на рис. 6.

За допомогою діаграм Ейлера-Венна можна ввести ще дві операції над множинами подій, результатами яких є відповідно поняття різниці множин подій А і В та їх диз'юнктивної суми.

Визначення 18. Якщо В Ì A, то різницею множин подій А і В називається множина подій С=А\В, яка складається з усіх елементів множини подій А, що не належать множині подій В. Поняття різниці подій легко усвідомити за допомогою рис. 7, на якому події, приналежні різниці подій С=А\В, мають вигляд заштрихованої областї.

Рис. 7. Геометрична інтерпретація різниці А\В подій А і В

Визначення 19. Диз'юнктивною сумою подій А і В прийнято називати множину подій, що належать або виключно множині А, або виключно множині В. Дана операція зазвичай позначається формулою S = А Å В.

За допомогою геометричної інтерпретації цієї операції шляхом використання діаграм Ейлера-Венна неважко переконатися в тому, що

.

На рис. 8 вертикальна штриховка визначає область , а похилі лінії визначають область .

Рис. 1.8. Інтерпретація дизюнктивної суми множин подій

Таким чином, та частина площі квадрата, яка заштрихована двома способами, і є областю, що належить диз'юнктивній сумі множин А і В, тобто ця сума дійсно дорівнює

S = .

Операція диз'юнктивної суми множин подій володіє численними властивостями. Зокрема, для неї справедливі наступні співвідношення:

А Å В = В Å А,

що відображає властивість комутативності диз'юнктивної суми;

Å В) Å С = A Å (BÅ C),

що відображає властивість асоціативності диз'юнктивної суми;

А Å Æ = Æ Å А,

що відображає існування нейтрального елементу для диз'юнктивної суми; таким нульовим елементом виступає порожня множина Æ.

Висновки

В лекції 4 розглянуто графічне подання числової інформації, представленої інтервальним рядом вибіркової статистичної сукупності, приведено приклади побудови гістограми розподілу спостережень та діаграм Ейлера-Венна для пояснення властивостей подій.

Завдання і питання для самоперевірки

1. Привести означення операції обєднання подій і пояснити її сенс за допомогою діаграми Ейлера Венна.

2. Привести означення операції перетину подій і пояснити її сенс за допомогою діаграми Ейлера-Венна.

3. Привести означення порожньої події і розкрити їїсутність.

4. У чому полягають переваги використання діаграм Ейлера-Венна при вивченні операцій над подіями?

Літературні джерела:

1. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных. – М.: Финансы и статистика, 1983. – 471 с.

2. Сигел Э.Ф. Практическая бизнес-статистика. – М.: Вильямс, 2002. – 1056 с.

3. Мельник В.М. Тринадцять лекцій з теорії ймовірностей: Текст лекцій / В.М. Мельник, О.П. Созник. – Х.: Акад. ВВ МВС України, 2008. – 112 с.

4. Пономарев А.С. Нечеткие множества в задачах автоматизированного управления и принятия решений: Навчальний посібник. – Харків: НТУ «ХПІ», 2005. – 232 с.

5. Игуменцева Н.В., Пахомов В.И. Статистический анализ результатов наблюдений: Учебное пособие. – Харьков: СМИТ, 2005. – 236 с.


 

А также другие работы, которые могут Вас заинтересовать

67108. Народні казки 149 KB
  Мета. Формування ключових компетентностей: вміння вчитися – самоорганізовуватися до навчальної діяльності у взаємодії; загальнокультурної – дотримуватися норм мовленнєвої культури, зв'язно висловлюватися в контексті змісту; соціальної – проектувати стратегії своєї поведінки з урахуванням інтересів та потреб інших...
67109. Київ – столиця України 503.5 KB
  Повідомлення теми і мети уроку Сьогодні ми перевернемо деякі сторінки історії міста Києва познайомимось з історичними версіями назв районів міста його вулиць. Вивчення нового матеріалу Давайте разом перегорнемо сторінки історії утворення Києва столиці нашої країни. Над Подолом районом Києва висяться ще дві гори...
67110. Шкільна кімната Бойової Слави: історична краєзнавча освіта школярів 107.5 KB
  У той час в кожній учнівській групі виникли пошукові загони які розпочали збір експонатів для майбутньої Кімнати. І на зборах школи було прийнято рішення про відкриття кімнати Бойової Слави. Найменша організаційна ланка кімнати Бойової Слави відділ який має свою назву та об’єднує дітей за інтересами.
67111. Папір. Види паперу. Загальне уявлення про виробництво паперу 32.5 KB
  Обладнання: таблиці із зображенням послідовності процесу виготовлення паперу дидактичний матеріал із видами паперу картон клей пензлик гофрований папір зразки роботи. Тут усіх вітають майстер Папірчик та його помічники. На уроці ви довідаєтесь яким буває папір та як його виготовляють створите аплікацію.
67112. Гриби – це користь чи отрута? 6.22 MB
  Розповісти учням про позитивні та негативні якості грибів. Навчити учнів правилам техніки безпеки при споживанні та зборі грибів. Засвоїти правила першої допомоги при отруєнні грибами. Розширити вміння учнів працювати в групах, працювати з додатковою літературою.
67113. Гумористично-розважальний захід 44 KB
  Але чи завжди ми прислухаємося до них ІІ ведучий: Сьогодні в нас є чудова нагода поспілкуватися триває тиждень української мови. І ведучий: А я хочу навести цікавий приклад. Може це й правильно ІІ ведучий: Отже нам приємно бачити всіх хто відгукнувся на наше запрошення.
67116. ФІ3ИКА НАВКОЛО НАС 68 KB
  Мета: зацікавити дітей показом цікавих i ефектних дослідів, які можна поясните на основі знанъ з кypcv природознавства та географії. Навчити спостерігати i робити висновки. Проілюструвати єдність законів природи. Зацікавити дітей майбутнім предметом.