15710

ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ

Лекция

Математика и математический анализ

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ СПОСТЕРЕЖЕНЬ Модуль 1: ОСНОВНІ ПОЛОЖЕННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ Лекція 4: ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ План лекції 4: 4.1. Інтервальний ряд вибіркової статистичної сукупності. 4.2. Робота з гістограм...

Украинкский

2013-06-15

499.5 KB

21 чел.

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ

СПОСТЕРЕЖЕНЬ

Модуль 1: ОСНОВНІ ПОЛОЖЕННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ

Лекція 4: ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ

План лекції 4:

4.1. Інтервальний ряд вибіркової статистичної сукупності.

4.2. Робота з гістограмою розподілу кількості спостережень.

4.3. Діаграми Ейлера-Венна для пояснення властивостей подій.

4.1. Інтервальний ряд вибіркової статистичної сукупності.

Для первинної обробки експериментальних даних вибірки потрібні такі основні статистичні параметри: середнє арифметичне значення; вибіркова дисперсія; середнє квадратичне відхилення; коефіцієнт варіації; середня помилка середнього значення; показник точності досліду.

Якщо кількість спостережень N у вибірці понад 20, то задля упоряд-кування і систематизації вибірки весь діапазон значень розбивають на інтервали, сукупність яких складає іитервальний ряд.

Кількість інтервалів визначається за формулою:

K = 1 + 3,2lgN.

Усі інтервали вибірки приймаються однакової величини (довжини), яку знаходять за формулою:

y = (утах утіп)/K,

де утах та утіп – найбільше та найменше значення у вибірці.

Кількість значень пі, що потрапили в один із інтервалів, визначають частоту потрапляння в інтервал. Упорядкований ряд середніх значень інтервалів уі, що зростають, називається статистичним рядом. Графічне зображення статистичного ряду, координатами якого є частота інтервалу (вісь у) і довжина інтервалу (вісь х), називається гістограмою.

Приклад 1. Визначити основні статистичні параметри та побудувати гістограму вибірки з N = 10 замірів твердості паперорізальних ножів в одиницях HRC: 61, 62, 65, 66, 65, 65, 67, 63, 63, 64.

Аналіз отриманих замірів свідчить, що мінімальне значення твердості утin. = 61, а максимальне значення уmax = 67. Таким чином, діапазон спосте-режень являє собою відрізок [61, 67], довжина якого дорівнює 67 – 61 = 6.

Розібємо діапазон спостережень на відрізки (розряди) такої довжини, щоб кожний з них мав декілька експериментальніх даних. Можна, відрізок [61, 67] розділити на 6 або 4 частин. Довжина кожного розряду дорівнюва-тиме 1,0 або 1,5.

Для визначеності приймемо кількість інтервалів згідно формули:

К = 1 + 3,2lgN = 1 + 3,2 × lg10 = 1 + 3,2 × 1,0 = 4,2.

Округлимо кількість інтервалів К = 4. Величина інтервалу дорівнює: 

y = (6761) / 4 = 1,5.

Складемо таблицю 1 для визначення основних параметрів.

Таблиця 1

Номер інтер-валу

уін  –  уів

ni

уі cр

ni×уі cр

і cр - )2

ni×і cр - )2

1

61,0  62,5

2

61,75

123,5

5,0625

10,125

2

62,5 – 64,0

3

63,25

189,5

0,5625

1,6875

3

64,0 – 65,5

3

64,75

194,25

0,5625

1,6875

4

65,5 – 67,5

2

66,25

132,5

5,0625

10,125

Σ = 640

Σ = 23,625

Ycр = 64 

S2 = 2,625

Середнє значення вибірки = 64 і вибіркову дисперсію S2 = Σ/(n - 1) = = 23, 625 /9 = 2,625 визначаємо за відповідними формулами. На основі даних таблиці 1 будуємо гістограму, яка зображена на рис. 1.

Рис.1. Гістограма розподілу кількості спостережень

4.2. Робота з гістограмою розподілу кількості спостережень.

Однією з найбільш розповсюджених графічних форм представлення інформації є гістограма. Гістограма несе інформацію про те, як розподілені об'єкти на шкалі. Тому її часто називають просто розподілом об'єктів за ознакою. Для побудови гістограми область зміни ознак розбивають на ряд інтервалів, далі підраховують кількість об'єктів, які потрапили в кожний інтервал, і на його місці зображується стовпчик  відповідної висоти.

Чим більша кількість інтервалів, тим більш зазубреною буде гістограма, чим менше – тим більш гладкою, але при цьому можуть пропасти подробиці.

Форма гістограми та її характеристики несуть багату інформацію про структуру даних і розподіл об'єктів техніко-економічних даних. Чимало висновків і методів статистики ґрунтуються на використанні значень параметрів розподілів, особливо параметрів, що характеризують положення розподілу (координату його центру) і масштаб (розкид відносно центра).

Ці параметри можна не тільки кількісно оцінити за гістограмою, але й побачити їх. За гістограмою можна також оцінити функцію, яка описує розподіл, що також необхідно для використання низки статистичних методів.

Приступаючи до роботи з гістограмою, перш за все слід оцінити наявність групувань об'єктів. Якщо на гістограмі чітко проглядаються два-три «горби», то це означає наявність груп (рис. 2).

Рис. 2. Гістограма з «горбами»

Слід зауважити, що занадто поглиблений аналіз форми гістограми, особливо при незначній (менше 50) кількості об'єктів, може привести до невірних висновків, оскільки слабко виражені «пагорби і ями» можуть бути обумовлені не впливом групувань, а просто випадковими відхиленнями.

Якщо групування об'єктів не спостерігається, тобто є підстави вважати вибірку однорідною за деякою ознакою, то при подальшому аналізі корисними можуть бути простіші кількісні характеристики вибірки, які є оцінками параметрів теоретичного розподілу.

Більшість розподілів, котрі зустрічаються на практиці, мають дзвонопо-дібну функцію щільності розподілу (до неї наближається обвідна (огинаюча) гістограми при збільшенні числа об'єктів у вибірці), а частіше усього дослідники мають справу з нормальним, або гаусовим, розподілом.

Його параметрами є математичне сподівання М – координата центра і стандартне відхилення σхарактеристика розкиду (в інтервал ±2σ потрапляє 95,4% об'єктів сукупності, а в інтервал ±2σ потрапляє 99,7%).

Оцінками цих параметрів є середнє значення вибірки т і вибіркове середньоквадратичне відхилення S, котрі зазвичай обчислюються і виводяться на друк в програмах обробки даних.

Якщо гістограма приблизно симетрична, її «хвости» не надто довгі (не більше п'яти об'єктів на сто лежать за межами інтервалу ±2S), ними цілком можна користуватись. При різко асиметричній гістограмі (рис. 3) більш зручною характеристикою «центра» вибірки є медіана – координата точки, що поділяє вибірку навпіл (50% об'єктів зліва, 50% справа).

Рис. 3. Гістограма з «важким» або «довгим» хвостом.

Для симетричних розподілів медіана і математичне очікування співпадають, для несиметричних можуть дуже суттєво відрізнятись; відповідно відрізняються і їх оцінки. Медіана більш стійка ло різких викидів в даних, чим середнє арифметичне, що дозволяє використовувати її при роботі з розподілами, які мають хвости.

Аналіз «засміченості», «виявлення» помилок в даних і аналіз рідкісних спостережень, що виділяються, – ще одна задача, вирішенню якої допомагає розгляд гістограми.

«Підозрілі» об'єкти знаходяться на краях гістограми, на далекій відстані від основної її частини. Відповідні їм значення ознак треба перевіряти на всіхетапах – від зняття даних до їх введення в пам'ять ЕОМ.

Якщо «підозрілі» дані виникли «на законній підставі», то можливі два варіанти: виключити їх з розгляду, вважаючи нетиповими для отриманої вибірки, або залишити, врахувавши їх вплив.

На користь першого варіанта говорить те, що чимало даних дуже залежать від впливу умов спостережень (як кажуть, нестійкі), і, як наслідок, результати аналізу втрачають статистичну точність. Другий варіант означає, що факт появи «підозрілих» даних має місце і його потрібно проаналізувати і зрозуміти причину виникнення. З цієї точки зору викиди можуть бути навіть більш цікавими для аналізу, ніж інші дані.

Для аналізу «засмічених» вибірок даних застосовуються методи робастного (від англ. «robust» – стійкий, міцний) статистичного оцінювання, які дозволяють отримати стійкі оцінки параметрів розподілу. Дані методи дають змогу виконувати «підчистку» даних, котрі характеризуються спотвореними густинами (рос. плотностями) розподілів і тим самим призводять їх до певного параметричного вигляду.

4.3. Діаграми Ейлера-Венна для пояснення властивостей подій

Для наочного подання множини подій і глибшого розуміння суті і властивостей операцій над ними в алгебрі подій широко застосовується геометрична інтерпретація вказаних властивостей подій у вигдяді так званих діаграм Ейлера-Венна [1, c. 8 – 10; 3, c. 17 – 220].

Так, на рис. 4 події, обмежені квадратом, можна вважати базовою або універсальною множиною подій X. Тоді область, обмежена колом, є підмножиною подій А цієї універсальної множини Х.

Рис. 4. Підмножина подій А універсальної множини подій Х

При такій геометричній інтерпретації множин подій ті точки квадрата, які не належать підмножині А, тобто розміщуються поза кругом, в заштрихованій частині квадрата, являють собою доповнення Ā підмножини А до універсальної множини X.

Про доповнення множини подій Ā до множини подій А можна говорити тільки щодо відносно певної універсальної множини подій Х. На рис. 5 приведена геометрична інтерпретація об'єднання множин подій А і В, а на рис. 6 – перетину множин подій А і В.

Рис. 5. Інтерпретація обєднання підмножин подій А і В

Рис. 6. Інтерпретація перетину підмножин подій А і В

Множини подій, що створюються в результаті зазначених операцій, представлені заштрихованими областями в полі квадрата універсальної множини подій. Слід звернути увагу на те, що зовнішня щодо результатів відповідних подій, тобто незаштрихована частина квадрата, є доповнення  до об'єднання AUВ множин подій А і В на рис. 5 і доповнення  до їх перетину АВ множин подій на рис. 6.

За допомогою діаграм Ейлера-Венна можна ввести ще дві операції над множинами подій, результатами яких є відповідно поняття різниці множин подій А і В та їх диз'юнктивної суми.

Визначення 18. Якщо В Ì A, то різницею множин подій А і В називається множина подій С=А\В, яка складається з усіх елементів множини подій А, що не належать множині подій В. Поняття різниці подій легко усвідомити за допомогою рис. 7, на якому події, приналежні різниці подій С=А\В, мають вигляд заштрихованої областї.

Рис. 7. Геометрична інтерпретація різниці А\В подій А і В

Визначення 19. Диз'юнктивною сумою подій А і В прийнято називати множину подій, що належать або виключно множині А, або виключно множині В. Дана операція зазвичай позначається формулою S = А Å В.

За допомогою геометричної інтерпретації цієї операції шляхом використання діаграм Ейлера-Венна неважко переконатися в тому, що

.

На рис. 8 вертикальна штриховка визначає область , а похилі лінії визначають область .

Рис. 1.8. Інтерпретація дизюнктивної суми множин подій

Таким чином, та частина площі квадрата, яка заштрихована двома способами, і є областю, що належить диз'юнктивній сумі множин А і В, тобто ця сума дійсно дорівнює

S = .

Операція диз'юнктивної суми множин подій володіє численними властивостями. Зокрема, для неї справедливі наступні співвідношення:

А Å В = В Å А,

що відображає властивість комутативності диз'юнктивної суми;

Å В) Å С = A Å (BÅ C),

що відображає властивість асоціативності диз'юнктивної суми;

А Å Æ = Æ Å А,

що відображає існування нейтрального елементу для диз'юнктивної суми; таким нульовим елементом виступає порожня множина Æ.

Висновки

В лекції 4 розглянуто графічне подання числової інформації, представленої інтервальним рядом вибіркової статистичної сукупності, приведено приклади побудови гістограми розподілу спостережень та діаграм Ейлера-Венна для пояснення властивостей подій.

Завдання і питання для самоперевірки

1. Привести означення операції обєднання подій і пояснити її сенс за допомогою діаграми Ейлера Венна.

2. Привести означення операції перетину подій і пояснити її сенс за допомогою діаграми Ейлера-Венна.

3. Привести означення порожньої події і розкрити їїсутність.

4. У чому полягають переваги використання діаграм Ейлера-Венна при вивченні операцій над подіями?

Літературні джерела:

1. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных. – М.: Финансы и статистика, 1983. – 471 с.

2. Сигел Э.Ф. Практическая бизнес-статистика. – М.: Вильямс, 2002. – 1056 с.

3. Мельник В.М. Тринадцять лекцій з теорії ймовірностей: Текст лекцій / В.М. Мельник, О.П. Созник. – Х.: Акад. ВВ МВС України, 2008. – 112 с.

4. Пономарев А.С. Нечеткие множества в задачах автоматизированного управления и принятия решений: Навчальний посібник. – Харків: НТУ «ХПІ», 2005. – 232 с.

5. Игуменцева Н.В., Пахомов В.И. Статистический анализ результатов наблюдений: Учебное пособие. – Харьков: СМИТ, 2005. – 236 с.


 

А также другие работы, которые могут Вас заинтересовать

75544. Україна. Географічне положення. Загальна характеристика. Нові ЛО 24.58 KB
  Ввести нові ЛО та відпрацювати їх вживання в мові. Практикувати учнів у читанні тексту з метою отримання загального уявлення (skimming) та з метою максимально повного й точного розуміння всієї інформації, що в ньому міститься (scanning)
75545. Географічне положення та державний устрій України 24.82 KB
  Т: We re going to tlk bout the politicl structure of Ukrine nd its geogrphicl position. By the end of the lesson you should be ble: to recognize nd understnd new words nd word combintions from the topic: The politicl structure of Ukrine in the text; to listen for the min ide nd specific informtion; to tlk bout the politicl structure of Ukrine in brief. One student from the clss is selected who thinks of geogrphicl plce in Ukrine tht must be guessed by the rest of the clss. Exmple: Is it river Is it mountin Is it one of the lrgest cities...
75546. Україна. Життя молоді, План-конспект уроку з англійської мови для учнів 9-х класів 23.9 KB
  People Підтема: Україна. re ll young people like Of course not. Thts why teengers esily come under the influence of other people. Young people re crzy bout music.
75547. Культура та наука в Україні, План-конспект уроку з англійської мови для учнів 9-х класів 22.03 KB
  Обладнання: підручник текст Culture nd Science in Ukrine HO1 Who is who H02. Т: We continue our work on the topic Ukrine. We re going to tlk bout culture nd science in Ukrine. By the end of the lesson you should be ble: to prticipte in common converstionl exchnges nd tell bout this topic using tl text nd wordcombintions s pln; to operte fcts bout Ukrine in new situtions.
75548. Київ - столиця України. Повторення ЛО теми Town Features 25.32 KB
  Обладнання: підручник слайди фотографії комплект учбових картин з видами міста Києва роздавальний матеріал round Kyiv НО1 картки з коротким описанням визначних місць Києва Н02 Mtch the English words nd word combintions with their Ukrinin equivlents H03 Which sentences do not fit to the text bout Kyiv HO4. Т: The topic of our...
75549. Київ - столиця України, План-конспект уроку з англійської мови для учнів 9-х класів 24.87 KB
  Активізація лексичного матеріалу теми Town Fetures. Активізація лексичного матеріалу теми Town Fetures. Т: There re mny ncient towns in Ukrine. Wht other ncient towns do you know Is your town villge old or new re there ny interesting fcts in the history of your town villge Why re people interested in the histories of cities towns nd villges Cn you explin the choice of nmes for some cities towns or villges Is the plce for town or villge chosen by chnce or for purpose Cn you give n exmple of it 2 WhileReding ctivities.
75552. З історії України, План-конспект уроку з англійської мови для учнів 9-х класів 28.83 KB
  By the end of the lesson you should be ble: to red the text for the min ide nd to find specific informtion; to tlk bout the historicl role of the Ukrinin Cosscks nd Ukrinin Hetmns. Етап підготовки до аудіювання тексту а Т: Wht things do you ssocite with the words Ukrinin Cosscks Write them on the blckbord mking Mind Mp . Mke s much sentences s possible bout the Ukrinin Cosscks using our Mind Mp . Exmple: The Ukrinin Cosscks were brve.