15710

ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ

Лекция

Математика и математический анализ

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ СПОСТЕРЕЖЕНЬ Модуль 1: ОСНОВНІ ПОЛОЖЕННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ Лекція 4: ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ План лекції 4: 4.1. Інтервальний ряд вибіркової статистичної сукупності. 4.2. Робота з гістограм...

Украинкский

2013-06-15

499.5 KB

21 чел.

Дисципліна: МАТЕМАТИЧНА СТАТИСТИКА ТА ОПРАЦЮВАННЯ

СПОСТЕРЕЖЕНЬ

Модуль 1: ОСНОВНІ ПОЛОЖЕННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ

Лекція 4: ГРАФІЧНЕ ПРЕДСТАВЛЕННЯ ЧИСЛОВОЇ ІНФОРМАЦІЇ

План лекції 4:

4.1. Інтервальний ряд вибіркової статистичної сукупності.

4.2. Робота з гістограмою розподілу кількості спостережень.

4.3. Діаграми Ейлера-Венна для пояснення властивостей подій.

4.1. Інтервальний ряд вибіркової статистичної сукупності.

Для первинної обробки експериментальних даних вибірки потрібні такі основні статистичні параметри: середнє арифметичне значення; вибіркова дисперсія; середнє квадратичне відхилення; коефіцієнт варіації; середня помилка середнього значення; показник точності досліду.

Якщо кількість спостережень N у вибірці понад 20, то задля упоряд-кування і систематизації вибірки весь діапазон значень розбивають на інтервали, сукупність яких складає іитервальний ряд.

Кількість інтервалів визначається за формулою:

K = 1 + 3,2lgN.

Усі інтервали вибірки приймаються однакової величини (довжини), яку знаходять за формулою:

y = (утах утіп)/K,

де утах та утіп – найбільше та найменше значення у вибірці.

Кількість значень пі, що потрапили в один із інтервалів, визначають частоту потрапляння в інтервал. Упорядкований ряд середніх значень інтервалів уі, що зростають, називається статистичним рядом. Графічне зображення статистичного ряду, координатами якого є частота інтервалу (вісь у) і довжина інтервалу (вісь х), називається гістограмою.

Приклад 1. Визначити основні статистичні параметри та побудувати гістограму вибірки з N = 10 замірів твердості паперорізальних ножів в одиницях HRC: 61, 62, 65, 66, 65, 65, 67, 63, 63, 64.

Аналіз отриманих замірів свідчить, що мінімальне значення твердості утin. = 61, а максимальне значення уmax = 67. Таким чином, діапазон спосте-режень являє собою відрізок [61, 67], довжина якого дорівнює 67 – 61 = 6.

Розібємо діапазон спостережень на відрізки (розряди) такої довжини, щоб кожний з них мав декілька експериментальніх даних. Можна, відрізок [61, 67] розділити на 6 або 4 частин. Довжина кожного розряду дорівнюва-тиме 1,0 або 1,5.

Для визначеності приймемо кількість інтервалів згідно формули:

К = 1 + 3,2lgN = 1 + 3,2 × lg10 = 1 + 3,2 × 1,0 = 4,2.

Округлимо кількість інтервалів К = 4. Величина інтервалу дорівнює: 

y = (6761) / 4 = 1,5.

Складемо таблицю 1 для визначення основних параметрів.

Таблиця 1

Номер інтер-валу

уін  –  уів

ni

уі cр

ni×уі cр

і cр - )2

ni×і cр - )2

1

61,0  62,5

2

61,75

123,5

5,0625

10,125

2

62,5 – 64,0

3

63,25

189,5

0,5625

1,6875

3

64,0 – 65,5

3

64,75

194,25

0,5625

1,6875

4

65,5 – 67,5

2

66,25

132,5

5,0625

10,125

Σ = 640

Σ = 23,625

Ycр = 64 

S2 = 2,625

Середнє значення вибірки = 64 і вибіркову дисперсію S2 = Σ/(n - 1) = = 23, 625 /9 = 2,625 визначаємо за відповідними формулами. На основі даних таблиці 1 будуємо гістограму, яка зображена на рис. 1.

Рис.1. Гістограма розподілу кількості спостережень

4.2. Робота з гістограмою розподілу кількості спостережень.

Однією з найбільш розповсюджених графічних форм представлення інформації є гістограма. Гістограма несе інформацію про те, як розподілені об'єкти на шкалі. Тому її часто називають просто розподілом об'єктів за ознакою. Для побудови гістограми область зміни ознак розбивають на ряд інтервалів, далі підраховують кількість об'єктів, які потрапили в кожний інтервал, і на його місці зображується стовпчик  відповідної висоти.

Чим більша кількість інтервалів, тим більш зазубреною буде гістограма, чим менше – тим більш гладкою, але при цьому можуть пропасти подробиці.

Форма гістограми та її характеристики несуть багату інформацію про структуру даних і розподіл об'єктів техніко-економічних даних. Чимало висновків і методів статистики ґрунтуються на використанні значень параметрів розподілів, особливо параметрів, що характеризують положення розподілу (координату його центру) і масштаб (розкид відносно центра).

Ці параметри можна не тільки кількісно оцінити за гістограмою, але й побачити їх. За гістограмою можна також оцінити функцію, яка описує розподіл, що також необхідно для використання низки статистичних методів.

Приступаючи до роботи з гістограмою, перш за все слід оцінити наявність групувань об'єктів. Якщо на гістограмі чітко проглядаються два-три «горби», то це означає наявність груп (рис. 2).

Рис. 2. Гістограма з «горбами»

Слід зауважити, що занадто поглиблений аналіз форми гістограми, особливо при незначній (менше 50) кількості об'єктів, може привести до невірних висновків, оскільки слабко виражені «пагорби і ями» можуть бути обумовлені не впливом групувань, а просто випадковими відхиленнями.

Якщо групування об'єктів не спостерігається, тобто є підстави вважати вибірку однорідною за деякою ознакою, то при подальшому аналізі корисними можуть бути простіші кількісні характеристики вибірки, які є оцінками параметрів теоретичного розподілу.

Більшість розподілів, котрі зустрічаються на практиці, мають дзвонопо-дібну функцію щільності розподілу (до неї наближається обвідна (огинаюча) гістограми при збільшенні числа об'єктів у вибірці), а частіше усього дослідники мають справу з нормальним, або гаусовим, розподілом.

Його параметрами є математичне сподівання М – координата центра і стандартне відхилення σхарактеристика розкиду (в інтервал ±2σ потрапляє 95,4% об'єктів сукупності, а в інтервал ±2σ потрапляє 99,7%).

Оцінками цих параметрів є середнє значення вибірки т і вибіркове середньоквадратичне відхилення S, котрі зазвичай обчислюються і виводяться на друк в програмах обробки даних.

Якщо гістограма приблизно симетрична, її «хвости» не надто довгі (не більше п'яти об'єктів на сто лежать за межами інтервалу ±2S), ними цілком можна користуватись. При різко асиметричній гістограмі (рис. 3) більш зручною характеристикою «центра» вибірки є медіана – координата точки, що поділяє вибірку навпіл (50% об'єктів зліва, 50% справа).

Рис. 3. Гістограма з «важким» або «довгим» хвостом.

Для симетричних розподілів медіана і математичне очікування співпадають, для несиметричних можуть дуже суттєво відрізнятись; відповідно відрізняються і їх оцінки. Медіана більш стійка ло різких викидів в даних, чим середнє арифметичне, що дозволяє використовувати її при роботі з розподілами, які мають хвости.

Аналіз «засміченості», «виявлення» помилок в даних і аналіз рідкісних спостережень, що виділяються, – ще одна задача, вирішенню якої допомагає розгляд гістограми.

«Підозрілі» об'єкти знаходяться на краях гістограми, на далекій відстані від основної її частини. Відповідні їм значення ознак треба перевіряти на всіхетапах – від зняття даних до їх введення в пам'ять ЕОМ.

Якщо «підозрілі» дані виникли «на законній підставі», то можливі два варіанти: виключити їх з розгляду, вважаючи нетиповими для отриманої вибірки, або залишити, врахувавши їх вплив.

На користь першого варіанта говорить те, що чимало даних дуже залежать від впливу умов спостережень (як кажуть, нестійкі), і, як наслідок, результати аналізу втрачають статистичну точність. Другий варіант означає, що факт появи «підозрілих» даних має місце і його потрібно проаналізувати і зрозуміти причину виникнення. З цієї точки зору викиди можуть бути навіть більш цікавими для аналізу, ніж інші дані.

Для аналізу «засмічених» вибірок даних застосовуються методи робастного (від англ. «robust» – стійкий, міцний) статистичного оцінювання, які дозволяють отримати стійкі оцінки параметрів розподілу. Дані методи дають змогу виконувати «підчистку» даних, котрі характеризуються спотвореними густинами (рос. плотностями) розподілів і тим самим призводять їх до певного параметричного вигляду.

4.3. Діаграми Ейлера-Венна для пояснення властивостей подій

Для наочного подання множини подій і глибшого розуміння суті і властивостей операцій над ними в алгебрі подій широко застосовується геометрична інтерпретація вказаних властивостей подій у вигдяді так званих діаграм Ейлера-Венна [1, c. 8 – 10; 3, c. 17 – 220].

Так, на рис. 4 події, обмежені квадратом, можна вважати базовою або універсальною множиною подій X. Тоді область, обмежена колом, є підмножиною подій А цієї універсальної множини Х.

Рис. 4. Підмножина подій А універсальної множини подій Х

При такій геометричній інтерпретації множин подій ті точки квадрата, які не належать підмножині А, тобто розміщуються поза кругом, в заштрихованій частині квадрата, являють собою доповнення Ā підмножини А до універсальної множини X.

Про доповнення множини подій Ā до множини подій А можна говорити тільки щодо відносно певної універсальної множини подій Х. На рис. 5 приведена геометрична інтерпретація об'єднання множин подій А і В, а на рис. 6 – перетину множин подій А і В.

Рис. 5. Інтерпретація обєднання підмножин подій А і В

Рис. 6. Інтерпретація перетину підмножин подій А і В

Множини подій, що створюються в результаті зазначених операцій, представлені заштрихованими областями в полі квадрата універсальної множини подій. Слід звернути увагу на те, що зовнішня щодо результатів відповідних подій, тобто незаштрихована частина квадрата, є доповнення  до об'єднання AUВ множин подій А і В на рис. 5 і доповнення  до їх перетину АВ множин подій на рис. 6.

За допомогою діаграм Ейлера-Венна можна ввести ще дві операції над множинами подій, результатами яких є відповідно поняття різниці множин подій А і В та їх диз'юнктивної суми.

Визначення 18. Якщо В Ì A, то різницею множин подій А і В називається множина подій С=А\В, яка складається з усіх елементів множини подій А, що не належать множині подій В. Поняття різниці подій легко усвідомити за допомогою рис. 7, на якому події, приналежні різниці подій С=А\В, мають вигляд заштрихованої областї.

Рис. 7. Геометрична інтерпретація різниці А\В подій А і В

Визначення 19. Диз'юнктивною сумою подій А і В прийнято називати множину подій, що належать або виключно множині А, або виключно множині В. Дана операція зазвичай позначається формулою S = А Å В.

За допомогою геометричної інтерпретації цієї операції шляхом використання діаграм Ейлера-Венна неважко переконатися в тому, що

.

На рис. 8 вертикальна штриховка визначає область , а похилі лінії визначають область .

Рис. 1.8. Інтерпретація дизюнктивної суми множин подій

Таким чином, та частина площі квадрата, яка заштрихована двома способами, і є областю, що належить диз'юнктивній сумі множин А і В, тобто ця сума дійсно дорівнює

S = .

Операція диз'юнктивної суми множин подій володіє численними властивостями. Зокрема, для неї справедливі наступні співвідношення:

А Å В = В Å А,

що відображає властивість комутативності диз'юнктивної суми;

Å В) Å С = A Å (BÅ C),

що відображає властивість асоціативності диз'юнктивної суми;

А Å Æ = Æ Å А,

що відображає існування нейтрального елементу для диз'юнктивної суми; таким нульовим елементом виступає порожня множина Æ.

Висновки

В лекції 4 розглянуто графічне подання числової інформації, представленої інтервальним рядом вибіркової статистичної сукупності, приведено приклади побудови гістограми розподілу спостережень та діаграм Ейлера-Венна для пояснення властивостей подій.

Завдання і питання для самоперевірки

1. Привести означення операції обєднання подій і пояснити її сенс за допомогою діаграми Ейлера Венна.

2. Привести означення операції перетину подій і пояснити її сенс за допомогою діаграми Ейлера-Венна.

3. Привести означення порожньої події і розкрити їїсутність.

4. У чому полягають переваги використання діаграм Ейлера-Венна при вивченні операцій над подіями?

Літературні джерела:

1. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных. – М.: Финансы и статистика, 1983. – 471 с.

2. Сигел Э.Ф. Практическая бизнес-статистика. – М.: Вильямс, 2002. – 1056 с.

3. Мельник В.М. Тринадцять лекцій з теорії ймовірностей: Текст лекцій / В.М. Мельник, О.П. Созник. – Х.: Акад. ВВ МВС України, 2008. – 112 с.

4. Пономарев А.С. Нечеткие множества в задачах автоматизированного управления и принятия решений: Навчальний посібник. – Харків: НТУ «ХПІ», 2005. – 232 с.

5. Игуменцева Н.В., Пахомов В.И. Статистический анализ результатов наблюдений: Учебное пособие. – Харьков: СМИТ, 2005. – 236 с.


 

А также другие работы, которые могут Вас заинтересовать

80377. Сучасні економічні системи. Особливості розвитку перехідних економік 258 KB
  Особливості розвитку перехідних економік Вступ до теми Мета заняття: охарактеризувати економічну систему капіталізму вільної конкуренції зясувати сутність монополістичного капіталізму; означити сутність та моделі змішаної економіки; охарактеризувати економічну систему сучасного капіталізму визначити механізм її функціонування розглянути еволюцію та перспективи розвитку сучасного капіталізму. Моделі змішаної економіки. Механізм функціонування соціалістичної економіки. Особливості ринкової трансформації української економіки.
80378. Економічні аспекти глобальних проблем та їх вплив на економічний розвиток України 121 KB
  Глобальні проблеми — це всезагальні проблеми, що відзначаються загальнопланетарним за своїми масштабами і значенням характером, повязані з життєвими інтересами народів усіх країн, становлять загрозу життю для всього людства і можуть бути вирішенні спільними діями всіх країн світу.
80379. ПРЕДМЕТ І МЕТОД ПОЛІТИЧНОЇ ЕКОНОМІЇ 136 KB
  Метою сьогоднішнього заняття є дослідити основні етапи розвитку та визначити предмет обєкт функції методи політекономії зясувати суть економічних категорій та законів а також визначити місце політичної економії в системі економічних наук. Політична економія як теоретикометодологічна база інших економічних наук. Oikonomi буквально мистецтво ведення домашнього господарства нині застосовують у чотирьох значеннях: народне господарство певної країни групи країн або всього світу; сфера господарської діяльності людини у якій...
80380. Виробництво матеріальних благ і послуг. Продукт і характер праці 138 KB
  Галузі виробництва. Основні фактори суспільного виробництва та їхній взаємозвязок. Соціальна і економічна ефективність виробництва. Метою сьогоднішнього заняття є дослідити процес суспільного виробництва фактори які впливають на процес виробництва; межу виробничих можливостей; продуктивні сили суспільства.
80381. ЕКОНОМІЧНІ ПОТРЕБИ ТА ЕКОНОМІЧНІ ІНТЕРЕСИ 157 KB
  Метою заняття є розкриття суті економічних потреб їх безмежності розгляд закону зростання потреб охарактеризувати корисність блага і суть економічних інтересів. План Економічні потреби суспільства їх сутність і класифікація. Безмежність потреб.
80382. Соціально-економічний устрій суспільства. Економічна система та закони її розвитку 165.5 KB
  Економічний зміст власності типи види форми. Економічний зміст та юридична форма власності. Типи види і форми власності. Наслідки процесів роздержавлення і приватизації власності в Україні.
80383. Правовий режим земель природно-заповідного фонду й іншого природоохоронного призначення 47.76 KB
  Землі природно-заповідного фонду — це ділянки суші і водного простору з природними комплексами та обєктами, що мають особливу природоохоронну, екологічну, наукову, естетичну, рекреаційну та іншу цінність, яким відповідно до закону надано статус територій
80384. Правовий режим земель оздоровчого та рекреаційного призначення 45.55 KB
  До земель оздоровчого призначення належать землі, що мають природні лікувальні властивості, що їх використовують або Вони можуть використовуватися для профілактики захворювань і лікування людей. Лікувально-оздоровчі властивості мають не самі землі
80385. Правовий режим земель історико-культурного призначення 50.46 KB
  емлі історико-культурного призначення можуть перебувати у державній, комунальній та приватній власності. При цьому Закон України «Про охорону культурної спадщини» передбачає особливості здійснення права власності на такі землі залежно