15710

ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ

Лекция

Математика и математический анализ

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ СПОСТЕРЕЖЕНЬ Модуль 1: ОСНОВНІ ПОЛОЖЕННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ Лекція 4: ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ План лекції 4: 4.1. Інтервальний ряд вибіркової статистичної сукупності. 4.2. Робота з гістограм...

Украинкский

2013-06-15

499.5 KB

21 чел.

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ

СПОСТЕРЕЖЕНЬ

Модуль 1: ОСНОВНІ ПОЛОЖЕННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ

Лекція 4: ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ

План лекції 4:

4.1. Інтервальний ряд вибіркової статистичної сукупності.

4.2. Робота з гістограмою розподілу кількості спостережень.

4.3. Діаграми Ейлера-Венна для пояснення властивостей подій.

4.1. Інтервальний ряд вибіркової статистичної сукупності.

Для первинної обробки експериментальних даних вибірки потрібні такі основні статистичні параметри: середнє арифметичне значення; вибіркова дисперсія; середнє квадратичне відхилення; коефіцієнт варіації; середня помилка середнього значення; показник точності досліду.

Якщо кількість спостережень N у вибірці понад 20, то задля упоряд-кування і систематизації вибірки весь діапазон значень розбивають на інтервали, сукупність яких складає іитервальний ряд.

Кількість інтервалів визначається за формулою:

K = 1 + 3,2lgN.

Усі інтервали вибірки приймаються однакової величини (довжини), яку знаходять за формулою:

y = (утах утіп)/K,

де утах та утіп – найбільше та найменше значення у вибірці.

Кількість значень пі, що потрапили в один із інтервалів, визначають частоту потрапляння в інтервал. Упорядкований ряд середніх значень інтервалів уі, що зростають, називається статистичним рядом. Графічне зображення статистичного ряду, координатами якого є частота інтервалу (вісь у) і довжина інтервалу (вісь х), називається гістограмою.

Приклад 1. Визначити основні статистичні параметри та побудувати гістограму вибірки з N = 10 замірів твердості паперорізальних ножів в одиницях HRC: 61, 62, 65, 66, 65, 65, 67, 63, 63, 64.

Аналіз отриманих замірів свідчить, що мінімальне значення твердості утin. = 61, а максимальне значення уmax = 67. Таким чином, діапазон спосте-режень являє собою відрізок [61, 67], довжина якого дорівнює 67 – 61 = 6.

Розібємо діапазон спостережень на відрізки (розряди) такої довжини, щоб кожний з них мав декілька експериментальніх даних. Можна, відрізок [61, 67] розділити на 6 або 4 частин. Довжина кожного розряду дорівнюва-тиме 1,0 або 1,5.

Для визначеності приймемо кількість інтервалів згідно формули:

К = 1 + 3,2lgN = 1 + 3,2 × lg10 = 1 + 3,2 × 1,0 = 4,2.

Округлимо кількість інтервалів К = 4. Величина інтервалу дорівнює: 

y = (6761) / 4 = 1,5.

Складемо таблицю 1 для визначення основних параметрів.

Таблиця 1

Номер інтер-валу

уін  –  уів

ni

уі cр

ni×уі cр

і cр - )2

ni×і cр - )2

1

61,0  62,5

2

61,75

123,5

5,0625

10,125

2

62,5 – 64,0

3

63,25

189,5

0,5625

1,6875

3

64,0 – 65,5

3

64,75

194,25

0,5625

1,6875

4

65,5 – 67,5

2

66,25

132,5

5,0625

10,125

Σ = 640

Σ = 23,625

Ycр = 64 

S2 = 2,625

Середнє значення вибірки = 64 і вибіркову дисперсію S2 = Σ/(n - 1) = = 23, 625 /9 = 2,625 визначаємо за відповідними формулами. На основі даних таблиці 1 будуємо гістограму, яка зображена на рис. 1.

Рис.1. Гістограма розподілу кількості спостережень

4.2. Робота з гістограмою розподілу кількості спостережень.

Однією з найбільш розповсюджених графічних форм представлення інформації є гістограма. Гістограма несе інформацію про те, як розподілені об'єкти на шкалі. Тому її часто називають просто розподілом об'єктів за ознакою. Для побудови гістограми область зміни ознак розбивають на ряд інтервалів, далі підраховують кількість об'єктів, які потрапили в кожний інтервал, і на його місці зображується стовпчик  відповідної висоти.

Чим більша кількість інтервалів, тим більш зазубреною буде гістограма, чим менше – тим більш гладкою, але при цьому можуть пропасти подробиці.

Форма гістограми та її характеристики несуть багату інформацію про структуру даних і розподіл об'єктів техніко-економічних даних. Чимало висновків і методів статистики ґрунтуються на використанні значень параметрів розподілів, особливо параметрів, що характеризують положення розподілу (координату його центру) і масштаб (розкид відносно центра).

Ці параметри можна не тільки кількісно оцінити за гістограмою, але й побачити їх. За гістограмою можна також оцінити функцію, яка описує розподіл, що також необхідно для використання низки статистичних методів.

Приступаючи до роботи з гістограмою, перш за все слід оцінити наявність групувань об'єктів. Якщо на гістограмі чітко проглядаються два-три «горби», то це означає наявність груп (рис. 2).

Рис. 2. Гістограма з «горбами»

Слід зауважити, що занадто поглиблений аналіз форми гістограми, особливо при незначній (менше 50) кількості об'єктів, може привести до невірних висновків, оскільки слабко виражені «пагорби і ями» можуть бути обумовлені не впливом групувань, а просто випадковими відхиленнями.

Якщо групування об'єктів не спостерігається, тобто є підстави вважати вибірку однорідною за деякою ознакою, то при подальшому аналізі корисними можуть бути простіші кількісні характеристики вибірки, які є оцінками параметрів теоретичного розподілу.

Більшість розподілів, котрі зустрічаються на практиці, мають дзвонопо-дібну функцію щільності розподілу (до неї наближається обвідна (огинаюча) гістограми при збільшенні числа об'єктів у вибірці), а частіше усього дослідники мають справу з нормальним, або гаусовим, розподілом.

Його параметрами є математичне сподівання М – координата центра і стандартне відхилення σхарактеристика розкиду (в інтервал ±2σ потрапляє 95,4% об'єктів сукупності, а в інтервал ±2σ потрапляє 99,7%).

Оцінками цих параметрів є середнє значення вибірки т і вибіркове середньоквадратичне відхилення S, котрі зазвичай обчислюються і виводяться на друк в програмах обробки даних.

Якщо гістограма приблизно симетрична, її «хвости» не надто довгі (не більше п'яти об'єктів на сто лежать за межами інтервалу ±2S), ними цілком можна користуватись. При різко асиметричній гістограмі (рис. 3) більш зручною характеристикою «центра» вибірки є медіана – координата точки, що поділяє вибірку навпіл (50% об'єктів зліва, 50% справа).

Рис. 3. Гістограма з «важким» або «довгим» хвостом.

Для симетричних розподілів медіана і математичне очікування співпадають, для несиметричних можуть дуже суттєво відрізнятись; відповідно відрізняються і їх оцінки. Медіана більш стійка ло різких викидів в даних, чим середнє арифметичне, що дозволяє використовувати її при роботі з розподілами, які мають хвости.

Аналіз «засміченості», «виявлення» помилок в даних і аналіз рідкісних спостережень, що виділяються, – ще одна задача, вирішенню якої допомагає розгляд гістограми.

«Підозрілі» об'єкти знаходяться на краях гістограми, на далекій відстані від основної її частини. Відповідні їм значення ознак треба перевіряти на всіхетапах – від зняття даних до їх введення в пам'ять ЕОМ.

Якщо «підозрілі» дані виникли «на законній підставі», то можливі два варіанти: виключити їх з розгляду, вважаючи нетиповими для отриманої вибірки, або залишити, врахувавши їх вплив.

На користь першого варіанта говорить те, що чимало даних дуже залежать від впливу умов спостережень (як кажуть, нестійкі), і, як наслідок, результати аналізу втрачають статистичну точність. Другий варіант означає, що факт появи «підозрілих» даних має місце і його потрібно проаналізувати і зрозуміти причину виникнення. З цієї точки зору викиди можуть бути навіть більш цікавими для аналізу, ніж інші дані.

Для аналізу «засмічених» вибірок даних застосовуються методи робастного (від англ. «robust» – стійкий, міцний) статистичного оцінювання, які дозволяють отримати стійкі оцінки параметрів розподілу. Дані методи дають змогу виконувати «підчистку» даних, котрі характеризуються спотвореними густинами (рос. плотностями) розподілів і тим самим призводять їх до певного параметричного вигляду.

4.3. Діаграми Ейлера-Венна для пояснення властивостей подій

Для наочного подання множини подій і глибшого розуміння суті і властивостей операцій над ними в алгебрі подій широко застосовується геометрична інтерпретація вказаних властивостей подій у вигдяді так званих діаграм Ейлера-Венна [1, c. 8 – 10; 3, c. 17 – 220].

Так, на рис. 4 події, обмежені квадратом, можна вважати базовою або універсальною множиною подій X. Тоді область, обмежена колом, є підмножиною подій А цієї універсальної множини Х.

Рис. 4. Підмножина подій А універсальної множини подій Х

При такій геометричній інтерпретації множин подій ті точки квадрата, які не належать підмножині А, тобто розміщуються поза кругом, в заштрихованій частині квадрата, являють собою доповнення Ā підмножини А до універсальної множини X.

Про доповнення множини подій Ā до множини подій А можна говорити тільки щодо відносно певної універсальної множини подій Х. На рис. 5 приведена геометрична інтерпретація об'єднання множин подій А і В, а на рис. 6 – перетину множин подій А і В.

Рис. 5. Інтерпретація обєднання підмножин подій А і В

Рис. 6. Інтерпретація перетину підмножин подій А і В

Множини подій, що створюються в результаті зазначених операцій, представлені заштрихованими областями в полі квадрата універсальної множини подій. Слід звернути увагу на те, що зовнішня щодо результатів відповідних подій, тобто незаштрихована частина квадрата, є доповнення  до об'єднання AUВ множин подій А і В на рис. 5 і доповнення  до їх перетину АВ множин подій на рис. 6.

За допомогою діаграм Ейлера-Венна можна ввести ще дві операції над множинами подій, результатами яких є відповідно поняття різниці множин подій А і В та їх диз'юнктивної суми.

Визначення 18. Якщо В Ì A, то різницею множин подій А і В називається множина подій С=А\В, яка складається з усіх елементів множини подій А, що не належать множині подій В. Поняття різниці подій легко усвідомити за допомогою рис. 7, на якому події, приналежні різниці подій С=А\В, мають вигляд заштрихованої областї.

Рис. 7. Геометрична інтерпретація різниці А\В подій А і В

Визначення 19. Диз'юнктивною сумою подій А і В прийнято називати множину подій, що належать або виключно множині А, або виключно множині В. Дана операція зазвичай позначається формулою S = А Å В.

За допомогою геометричної інтерпретації цієї операції шляхом використання діаграм Ейлера-Венна неважко переконатися в тому, що

.

На рис. 8 вертикальна штриховка визначає область , а похилі лінії визначають область .

Рис. 1.8. Інтерпретація дизюнктивної суми множин подій

Таким чином, та частина площі квадрата, яка заштрихована двома способами, і є областю, що належить диз'юнктивній сумі множин А і В, тобто ця сума дійсно дорівнює

S = .

Операція диз'юнктивної суми множин подій володіє численними властивостями. Зокрема, для неї справедливі наступні співвідношення:

А Å В = В Å А,

що відображає властивість комутативності диз'юнктивної суми;

Å В) Å С = A Å (BÅ C),

що відображає властивість асоціативності диз'юнктивної суми;

А Å Æ = Æ Å А,

що відображає існування нейтрального елементу для диз'юнктивної суми; таким нульовим елементом виступає порожня множина Æ.

Висновки

В лекції 4 розглянуто графічне подання числової інформації, представленої інтервальним рядом вибіркової статистичної сукупності, приведено приклади побудови гістограми розподілу спостережень та діаграм Ейлера-Венна для пояснення властивостей подій.

Завдання і питання для самоперевірки

1. Привести означення операції обєднання подій і пояснити її сенс за допомогою діаграми Ейлера Венна.

2. Привести означення операції перетину подій і пояснити її сенс за допомогою діаграми Ейлера-Венна.

3. Привести означення порожньої події і розкрити їїсутність.

4. У чому полягають переваги використання діаграм Ейлера-Венна при вивченні операцій над подіями?

Літературні джерела:

1. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных. – М.: Финансы и статистика, 1983. – 471 с.

2. Сигел Э.Ф. Практическая бизнес-статистика. – М.: Вильямс, 2002. – 1056 с.

3. Мельник В.М. Тринадцять лекцій з теорії ймовірностей: Текст лекцій / В.М. Мельник, О.П. Созник. – Х.: Акад. ВВ МВС України, 2008. – 112 с.

4. Пономарев А.С. Нечеткие множества в задачах автоматизированного управления и принятия решений: Навчальний посібник. – Харків: НТУ «ХПІ», 2005. – 232 с.

5. Игуменцева Н.В., Пахомов В.И. Статистический анализ результатов наблюдений: Учебное пособие. – Харьков: СМИТ, 2005. – 236 с.


 

А также другие работы, которые могут Вас заинтересовать

8355. Культура Древнего Востока. Бхавадгита 98 KB
  Культура Древнего Востока. БХАГАВАДГИТА КАК ОНА ЕСТЬ Арджуна спросил: О мой Господь, о Высшая личность, что такое Брахман? Что такое душа? Что такое кармическая деятельность? Что представляет собой это материальное проявление? Кто такие полубоги? По...
8356. История Китая. Краткий обзор 482.32 KB
  История Китая Китайская цивилизация - одна из старейших в мире. По утверждениям китайских учёных, её возраст может составлять пять тысяч лет, при этом имеющиеся письменные источники покрывают период не менее 3500 лет. Наличие систем администрат...
8357. Хрестоматія Китайської Літератури (від найдавніших часів до ІІІ ст. н.е.) 中国古代文学作品选 4.19 MB
  Хрестоматія Китайської Літератури(від найдавніших часів до ІІІ ст. н.е.) У хрестоматії широко представлена перекладна й оригінальна давньокитайська література, зокрема народна та авторська поезія, міфологічна, літописна, філософська ...
8358. Історія Китаю та китайських традицій 86.5 KB
  На сьогодні дві держави використовують назву Китай. Це Китайська Народна Республіка (КНР), яка контролює територію материкового Китаю, Гонконг та Макао, а також Республіка Китай, яка володіє островами Тайвань, Мацу і Кіньмень Китай (традиц...
8359. Влияние иностранных инвестиций на экономику Китая 124 KB
  Влияние иностранных инвестиций на экономику Китая Введение Процессы, происходящие в экономике Китая, на протяжении нескольких последних десятилетий привлекают к себе внимание специалистов и широкой мировой общественности. Достижения, демонстрируемые...
8360. История Китая 168.5 KB
  КИТАЙ По истории Китая вы помните, что в Китае сменялись разные династии. Для истории Китая характерна определенная цикличность. Приходит к власти новая династия, проводит реформы, все идет хорошо, процветание. А потом наступает упадок, и смена дина...
8361. Китайские церемонии или радостно встречая 18-ый съезд КПК 47.5 KB
  Китайские церемонии или радостно встречая 18-ый съезд КПК Связка трех сил внутри китайского руководства Учение Маркса (марксизм-ленинизм - идеи Мао Цзэдуна) было всесильным и верным в период индустриального общества борьбы труда и капитала. Теперь ж...
8362. Китай. Экономическое и политическое развитие КНР 707 KB
  План. Введение Экономико- и политико-географическое положение. Особенности исторического развития. Природно-ресурсные предпосылки для развития экономики. Земельные ресурсы. Минеральные ресурсы. Топливные ПИ...
8363. Средневековая китайско-конфуцианская цивилизация 286 KB
  Средневековая китайско-конфуцианская цивилизация I. Формирование основ средневекового китайского общества и государства: II в. до н.э. - VI в. н.э. Период Хань: конец II в. до н.э. - III в. н.э. Период Троецарствия: 220 гг....