36944

Побудова вибіркової функції розподілу засобами комп’ютерних технологій

Лабораторная работа

Информатика, кибернетика и программирование

Лабораторна робота №2 Тема: побудова вибіркової функції розподілу засобами компютерних технологій. У MthCD існують дві функції що дозволяють зробити обробку вибірки для наступної побудови гістограм. Оскільки методика створення гістограм з використанням функції hist досить складна надамо її по пунктах: Для початку представимо експериментальні дані у вигляді вектора.

Украинкский

2013-09-23

363.5 KB

9 чел.

Міністерство освіти і науки, молоді та спорту України

Національний транспортний університет

Факультет транспортних та інформаційних технологій

Кафедра інформаційних систем і технологій

Лабораторна робота №2

з дисципліни

«Комп’ютерні технології статистичної обробки інформації»

на тему

«Побудова вибіркової функції розподілу засобами комп’ютерних технологій»

 

Виконав:

Студент гр. КН-ІІІ-2

Дворник О.О.

Варіант – 5.

Перевірила:

доц. Парохненко Л.М.

Київ – 2011

Лабораторна робота №2

Тема: побудова вибіркової функції розподілу засобами комп’ютерних технологій.

Мета: ознайомитися з методикою побудови вибіркових функцій розподілу в Excel з використанням інструменту Гістограма з Пакету аналізу і навчитися побудови гістограм в середовищі MathCAD.

Теоретична довідка

  1.  Побудова гістограм.

Гістограма – це графік, що дозволяє візуалізувати відносну частоту влучення даних експериментальної вибірки у визначений числовий інтервал. При її побудові область, обумовлена по розмаху значень даних у вибірці, розбивається на деяке невелике (6-20) число проміжків (як правило, рівних), і потім підраховується відсоток елементів, влучивших до кожного з них. Сама гістограма являє собою стовпчасту діаграму, ширина сегмента якої відповідає величині проміжку, а висота – відносної частості влучення в нього даних. Проводячи паралелі, можна сказати, що в статистиці гістограма є повним аналогом кривої щільності розподілу в теорії імовірностей. Відповідно площа всіх її стовпців повинна бути нормована і дорівнювати 1.

Побудова гістограм вручну – трудомістка і непроста задача. У MathCAD же, завдяки наявності спеціальних функцій, вона вирішується досить легко. Більш того, художній рівень отриманих графіків заслуговує самих високих оцінок. З огляду на практичну важливість статистичних діаграм, розглянемо техніку їх створення.

  1.  Гістограми з довільною шириною стовпців.

У MathCAD існують дві функції, що дозволяють зробити обробку вибірки для наступної побудови гістограм. Перша з них, що з'явилася в ранніх версіях програми, функція hist (intvls,x), більш складна у використанні, однак при її допомозі можна будувати гістограми з нерівною шириною сегментів.

Функція hist (intvls,x) – вектор частоти попадання даних в інтервали гістограми:

  •  іntvls – вектор, елементи якого задають сегменти побудови гістограми в порядку зростання a<intvlsi<b;
  •  х – вектор випадкових даних.

Якщо вектор intvls має bin елементів, то і результат hist має стільки ж елементів. Оскільки методика створення гістограм з використанням функції hist досить складна, надамо її по пунктах:

  1.  Для початку представимо експериментальні дані у вигляді вектора. На практиці це робиться або безпосереднім їхнім занесенням у таблицю введення (Input Таble), або читанням з текстового або Excel файлу. Щоб одержати передбачуваний результат, скористаємося одним з генераторів випадкових чисел MathCAD. Наприклад, задамо вектор з 1000 нормально розподілених випадкових величин з математичним сподіванням µ=3 і середньоквадратичним відхилення σ = 1 :

  1.  Визначимо кількість стовпців майбутньої гістограми. У загальному випадку для цього можна скористатися спеціальною формулою, що обчислює верхню границю числа сегментів для коректної гістограми (утім, в MathCAD це можна зробити і довільним чином):

  1.  Далі обчислимо ширину сегментів гістограми. Зазвичай вона визначає відношення розмаху даних у вибірці до числа стовпців гістограми. У MathCAD розмах даних у векторі можна обчислити за допомогою спеціальних матричних функцій max(х) і min(х), що повертають, відповідно, найбільший і найменший його елемент. Щоб обчислити крок сегмента максимально коректно, граничні значення варто округлити. Для цього можна використовувати спеціальні функції floor(a) і ceil(a), що підраховують верхню і нижню границі округлення для числа а:

  1.  Використовуючи ранжовану змінну, задаємо вектор границь сегментів розбивки. У загальному випадку його можна визначити довільним чином. Але оскільки на практиці гістограми будуються практично винятково зі стовпцями рівної ширини, то і наш вектор задамо таким чином, щоб різниця між його сусідніми елементами дорівнювала по величині визначеному вище кроку:

  1.  За допомогою функції hist обчислюємо вектор, що містить як елемент кількість влучень у відповідний сегмент даних з досліджуваної вибірки. Ширина ж самих стовпців визначається цією функцією як різниця між сусідніми елементами заданого вище вектора t:

  1.  Виходячи з математичного змісту гістограми, розраховуємо на основі вектора f вектор частостей влучення даних у відповідні сегменти:

Враховувати величину кроку step у проведеній процедурі необхідно в зв'язку з умовою нормування (до речі, зверніть увагу, що використана формула є аналогом формули щільності імовірності, що застосовується в теорії ймовірностей).

  1.  Оскільки стовпці гістограми будуються виходячи з тієї умови, що елементи вектора t повинні відповідати їх серединам, проведемо його перевизначення:

 

Результат роботи:

Оскільки, стовпці гістограми будуються виходячи з того, що елементи вектора t повинні відповідати їх серединам, проведемо його перевизначення:

  1.  Побудова гістограми з рівною шириною стовпців.

Великим недоліком функції hist є те, що для неї необхідно задавати вектор, що містить значення границь сегментів. Функція, що з'явилася в останній версії програми, histogram(bin,x) цю частину роботи бере на себе.

Щоб побудувати гістограму за допомогою функції histogram (bin,x), потрібно визначитися з числом сегментів bin. Їхні границі і середини, які необхідні для розрахунку функція визначить сама.

Результатом роботи функції histogram є матриця розмірності binх2, у першому стовпці якої отримуються значення середин сегментів розбивки, у другому – число елементів вибірки, що потрапили на кожний з інтервалів. У найпростішому випадку, якщо нас цікавить тільки форма розподілу, ми можемо побудувати гістограму, виділивши за допомогою спеціального оператора ([Ctrl]+[6]) вектори відповідних координат з даної матриці. Однак для побудови коректного графіка все ж таки необхідно провести нормування.

Результат роботи:

  1.   Побудова вибіркової функції розподілу засобами Excel.

Для побудови вибіркової функції розподілу увесь діапазон зміни випадкової величини X розбивають на ряд інтервалів однакової ширини. Число інтервалів зазвичай вибирають не менше 5 і не більше 15. Потім визначають число значень випадкової величини X, що потрапила в кожен інтервал. Поділивши ці числа на загальну кількість спостережень n, знаходять відносну частоту попадання випадкової величини X в задані інтервали. По знайдених відносних частотах будують гістограми вибіркових функцій розподілу. Якщо відповідні точки відносних частот з'єднати ламаною лінією, то отримана діаграма називатиметься полігоном частот. Кумулятивна крива буде отримана, якщо по осі абсцис відкладати інтервали, а по осі ординат − число або долі елементів сукупності, що мають значення, менше або рівне заданому.

При збільшенні до безкінечності розміру вибірки вибіркові функції розподілу перетворюються на теоретичні: гістограма перетворюється на графік щільності розподілу, а кумулятивна крива − в графік функції розподілу.

У Excel для побудови вибіркових функцій розподілу використовуютьcя спеціальна функція ЧАСТОТА і процедура пакету аналізу Гистограмма.

  •  Функція ЧАСТОТА обчислює частоти появи випадкової величини в інтервалах значень і виводить їх як масив цифр. Функція задається в якості формули масиву.

Частота(масив_даных;масив_карманов).

Результат роботи:

 

Рис.1. Гістограма для функції Частота.

  •   Процедура Гистограмма використовується для обчислення вибіркових та інтегральних частот попадання даних у вказані інтервали значень. Процедура виводить результати у вигляді таблиці і гістограми.

Рис.2. Діалогове вікно процедури Гистограмма.

Результат роботи:

  1.  з порожнім полем Интервал карманов:

Рис.3. Гістограма для процедури Гистограмма з порожнім полем Интервал карманов.

  1.  із заповненим полем Интервал карманов:

Рис.4. Гістограма для процедури Гистограмма із заповненим полем Интервал карманов.

Як ми бачимо, гістограма на рис.4 дуже схожа на діаграму на рис.1. Це пояснюється тим, що був введений діапазон карманів. Інакше, кількість і границі інтервалів в процедурі Гистограмма визначалися автоматично, як показано на рис.3.

Висновки: при виконанні лабораторної роботи були отримані навики побудови вибіркових функцій розподілу в MS Excel з використанням функції Частота() і інструмент Гистограмма з Пакета анализа, ознайомилися з методикою побудови гістограм з довільною і рівною шириною стовбців в середовищі MathCAD за допомогою функцій hist і histogram.


 

А также другие работы, которые могут Вас заинтересовать

48413. Регіональна економіка 328.3 KB
  Міжгалузеві господарські комплекси та регіональні особливості їх розвитку і розміщення Паливноенергетичний комплекс: регіональні особливості розвитку і розміщення 75 ЛЕКЦІЯ 6. Міжгалузеві господарські комплекси та регіональні особливості їх розвитку і розміщення Хімічний комплекс: регіональні особливості розвитку і розміщення 93 ЛЕКЦІЯ 7. Економіка регіонів України: стан та перспективи розвитку 128 ЛЕКЦІЯ 9.030509 ОА 1 2 4 144 52 20 32 90 36 екзамен Мета: формування знань щодо теоретичних і практичних засад територіальної...
48414. Базові поняття Системного програмування та СПЗ 924.9 KB
  Системні програмні засоби виконують такі завдання як передача даних з памяті довільного доступу на диск або відтворення тексту на дисплеї. Через ці обмеження часто використовуються моніторинг та реєстрація даних; операційні системи мають бути забезпечені дуже якісними підсистемами реєстрації даних. Базові відомості Поняття операційної системи напряму пов'язане з такими поняттями як: Файл іменований впорядкований набір даних на пристрої зберігання інформації; операційна система забезпечує організацію файлів в файлові системи. Файлова...
48415. Державна мова — мова професійного спілкування 652.5 KB
  Правильно використовувати різні мовні засоби відповідно до комунікативних намірів; влучно висловлювати думки для успішного розв’язання проблем і завдань у професійній діяльності; сприймати, відтворювати, редагувати тексти офіційно-ділового й наукового стилів; скорочувати та створювати наукові тексти професійного спрямування, складати план, конспект, реферат тощо, робити необхідні нотатки, виписки відповідно до поставленої мети
48416. Лінійне програмування 112.29 KB
  При дослідженні різноманітних економічних процесів і явищ виникають задачі знаходження таких управлінських рішень які б давали змогу оптимізувати хід процесу явищ. До задач лінійного програмування належать ті задачі в яких функція мети лінійно залежить від керованих параметрів а також співвідношення між керованими і некерованими параметрами мають лінійний вигляд. Обмеження на сировину і її витрати на виготовлення 1 плити кожного виду а також прибуток від реалізації 1 плити задані в таблиці: Тип сировини Витрати на 1 плиту Запаси сировини...
48417. Лекції з історії світової та вітчизняної культури 4.76 MB
  ЗМІСТ ПЕРЕДМОВА ФІЛОСОФСЬКО-ТЕОРЕТИЧНІ ОСНОВИ ІСТОРІЇ КУЛЬТУРИ Поняття культури ПОНЯТТЯ СВГГОВОЇТА НАЦІОНАЛЬНОЇ КУЛЬТУРИ КУЛЬТУРА І СУЧАСНА ЦИВІЛІЗАЦІЯ Регіональна типологія світової культури
48418. Кримінально-процесуальне право України 837.42 KB
  Для захисту особи, суспільства і держави від кримінальних правопорушень, забезпечення того, щоб кожний, хто вчинив кримінальне правопорушення, був притягнутий до відповідальності в міру своєї вини, жоден невинуватий не був обвинувачений або засуджений, необхідно встановити фактичні обставини кримінального правопорушення, винуватість особи у його вчиненні та інші обставини
48419. Лекції з курсу програмування 233.39 KB
  Мови програмування Pscl Bsic Сі. 3 Алгоритмічною мовою або мовою програмування. Алгоритмічною мовою Мовою програмування Turbo Bsic алг Площа progrm squre; дійсн а b S...
48420. Слідчі дії та кримінальне судочинство 207.37 KB
  Підстави проведення негласних слідчих розшукових дій. Засоби що використовуються під час проведення негласних розшукових дій Лекція 3. Негласні слідчі розшукові дії законодавець визначив як різновид слідчих розшукових дій відомості про факт та методи проведення яких не підлягають розголошенню за винятком випадків передбачених Кримінальним процесуальним кодексом України ч. В звязку з цим авторським колективом Національної академії внутрішніх справ підготовлено курс лекцій за актуальними питаннями організації та тактики проведення...
48421. ТЕОРІЯ ТЕКСТУ 191.71 KB
  ТЕОРІЯ ТЕКСТУ Ознаки тексту. Функції тексту. Функції журналістського тексту.