36944

Побудова вибіркової функції розподілу засобами комп’ютерних технологій

Лабораторная работа

Информатика, кибернетика и программирование

Лабораторна робота №2 Тема: побудова вибіркової функції розподілу засобами компютерних технологій. У MthCD існують дві функції що дозволяють зробити обробку вибірки для наступної побудови гістограм. Оскільки методика створення гістограм з використанням функції hist досить складна надамо її по пунктах: Для початку представимо експериментальні дані у вигляді вектора.

Украинкский

2013-09-23

363.5 KB

9 чел.

Міністерство освіти і науки, молоді та спорту України

Національний транспортний університет

Факультет транспортних та інформаційних технологій

Кафедра інформаційних систем і технологій

Лабораторна робота №2

з дисципліни

«Комп’ютерні технології статистичної обробки інформації»

на тему

«Побудова вибіркової функції розподілу засобами комп’ютерних технологій»

 

Виконав:

Студент гр. КН-ІІІ-2

Дворник О.О.

Варіант – 5.

Перевірила:

доц. Парохненко Л.М.

Київ – 2011

Лабораторна робота №2

Тема: побудова вибіркової функції розподілу засобами комп’ютерних технологій.

Мета: ознайомитися з методикою побудови вибіркових функцій розподілу в Excel з використанням інструменту Гістограма з Пакету аналізу і навчитися побудови гістограм в середовищі MathCAD.

Теоретична довідка

  1.  Побудова гістограм.

Гістограма – це графік, що дозволяє візуалізувати відносну частоту влучення даних експериментальної вибірки у визначений числовий інтервал. При її побудові область, обумовлена по розмаху значень даних у вибірці, розбивається на деяке невелике (6-20) число проміжків (як правило, рівних), і потім підраховується відсоток елементів, влучивших до кожного з них. Сама гістограма являє собою стовпчасту діаграму, ширина сегмента якої відповідає величині проміжку, а висота – відносної частості влучення в нього даних. Проводячи паралелі, можна сказати, що в статистиці гістограма є повним аналогом кривої щільності розподілу в теорії імовірностей. Відповідно площа всіх її стовпців повинна бути нормована і дорівнювати 1.

Побудова гістограм вручну – трудомістка і непроста задача. У MathCAD же, завдяки наявності спеціальних функцій, вона вирішується досить легко. Більш того, художній рівень отриманих графіків заслуговує самих високих оцінок. З огляду на практичну важливість статистичних діаграм, розглянемо техніку їх створення.

  1.  Гістограми з довільною шириною стовпців.

У MathCAD існують дві функції, що дозволяють зробити обробку вибірки для наступної побудови гістограм. Перша з них, що з'явилася в ранніх версіях програми, функція hist (intvls,x), більш складна у використанні, однак при її допомозі можна будувати гістограми з нерівною шириною сегментів.

Функція hist (intvls,x) – вектор частоти попадання даних в інтервали гістограми:

  •  іntvls – вектор, елементи якого задають сегменти побудови гістограми в порядку зростання a<intvlsi<b;
  •  х – вектор випадкових даних.

Якщо вектор intvls має bin елементів, то і результат hist має стільки ж елементів. Оскільки методика створення гістограм з використанням функції hist досить складна, надамо її по пунктах:

  1.  Для початку представимо експериментальні дані у вигляді вектора. На практиці це робиться або безпосереднім їхнім занесенням у таблицю введення (Input Таble), або читанням з текстового або Excel файлу. Щоб одержати передбачуваний результат, скористаємося одним з генераторів випадкових чисел MathCAD. Наприклад, задамо вектор з 1000 нормально розподілених випадкових величин з математичним сподіванням µ=3 і середньоквадратичним відхилення σ = 1 :

  1.  Визначимо кількість стовпців майбутньої гістограми. У загальному випадку для цього можна скористатися спеціальною формулою, що обчислює верхню границю числа сегментів для коректної гістограми (утім, в MathCAD це можна зробити і довільним чином):

  1.  Далі обчислимо ширину сегментів гістограми. Зазвичай вона визначає відношення розмаху даних у вибірці до числа стовпців гістограми. У MathCAD розмах даних у векторі можна обчислити за допомогою спеціальних матричних функцій max(х) і min(х), що повертають, відповідно, найбільший і найменший його елемент. Щоб обчислити крок сегмента максимально коректно, граничні значення варто округлити. Для цього можна використовувати спеціальні функції floor(a) і ceil(a), що підраховують верхню і нижню границі округлення для числа а:

  1.  Використовуючи ранжовану змінну, задаємо вектор границь сегментів розбивки. У загальному випадку його можна визначити довільним чином. Але оскільки на практиці гістограми будуються практично винятково зі стовпцями рівної ширини, то і наш вектор задамо таким чином, щоб різниця між його сусідніми елементами дорівнювала по величині визначеному вище кроку:

  1.  За допомогою функції hist обчислюємо вектор, що містить як елемент кількість влучень у відповідний сегмент даних з досліджуваної вибірки. Ширина ж самих стовпців визначається цією функцією як різниця між сусідніми елементами заданого вище вектора t:

  1.  Виходячи з математичного змісту гістограми, розраховуємо на основі вектора f вектор частостей влучення даних у відповідні сегменти:

Враховувати величину кроку step у проведеній процедурі необхідно в зв'язку з умовою нормування (до речі, зверніть увагу, що використана формула є аналогом формули щільності імовірності, що застосовується в теорії ймовірностей).

  1.  Оскільки стовпці гістограми будуються виходячи з тієї умови, що елементи вектора t повинні відповідати їх серединам, проведемо його перевизначення:

 

Результат роботи:

Оскільки, стовпці гістограми будуються виходячи з того, що елементи вектора t повинні відповідати їх серединам, проведемо його перевизначення:

  1.  Побудова гістограми з рівною шириною стовпців.

Великим недоліком функції hist є те, що для неї необхідно задавати вектор, що містить значення границь сегментів. Функція, що з'явилася в останній версії програми, histogram(bin,x) цю частину роботи бере на себе.

Щоб побудувати гістограму за допомогою функції histogram (bin,x), потрібно визначитися з числом сегментів bin. Їхні границі і середини, які необхідні для розрахунку функція визначить сама.

Результатом роботи функції histogram є матриця розмірності binх2, у першому стовпці якої отримуються значення середин сегментів розбивки, у другому – число елементів вибірки, що потрапили на кожний з інтервалів. У найпростішому випадку, якщо нас цікавить тільки форма розподілу, ми можемо побудувати гістограму, виділивши за допомогою спеціального оператора ([Ctrl]+[6]) вектори відповідних координат з даної матриці. Однак для побудови коректного графіка все ж таки необхідно провести нормування.

Результат роботи:

  1.   Побудова вибіркової функції розподілу засобами Excel.

Для побудови вибіркової функції розподілу увесь діапазон зміни випадкової величини X розбивають на ряд інтервалів однакової ширини. Число інтервалів зазвичай вибирають не менше 5 і не більше 15. Потім визначають число значень випадкової величини X, що потрапила в кожен інтервал. Поділивши ці числа на загальну кількість спостережень n, знаходять відносну частоту попадання випадкової величини X в задані інтервали. По знайдених відносних частотах будують гістограми вибіркових функцій розподілу. Якщо відповідні точки відносних частот з'єднати ламаною лінією, то отримана діаграма називатиметься полігоном частот. Кумулятивна крива буде отримана, якщо по осі абсцис відкладати інтервали, а по осі ординат − число або долі елементів сукупності, що мають значення, менше або рівне заданому.

При збільшенні до безкінечності розміру вибірки вибіркові функції розподілу перетворюються на теоретичні: гістограма перетворюється на графік щільності розподілу, а кумулятивна крива − в графік функції розподілу.

У Excel для побудови вибіркових функцій розподілу використовуютьcя спеціальна функція ЧАСТОТА і процедура пакету аналізу Гистограмма.

  •  Функція ЧАСТОТА обчислює частоти появи випадкової величини в інтервалах значень і виводить їх як масив цифр. Функція задається в якості формули масиву.

Частота(масив_даных;масив_карманов).

Результат роботи:

 

Рис.1. Гістограма для функції Частота.

  •   Процедура Гистограмма використовується для обчислення вибіркових та інтегральних частот попадання даних у вказані інтервали значень. Процедура виводить результати у вигляді таблиці і гістограми.

Рис.2. Діалогове вікно процедури Гистограмма.

Результат роботи:

  1.  з порожнім полем Интервал карманов:

Рис.3. Гістограма для процедури Гистограмма з порожнім полем Интервал карманов.

  1.  із заповненим полем Интервал карманов:

Рис.4. Гістограма для процедури Гистограмма із заповненим полем Интервал карманов.

Як ми бачимо, гістограма на рис.4 дуже схожа на діаграму на рис.1. Це пояснюється тим, що був введений діапазон карманів. Інакше, кількість і границі інтервалів в процедурі Гистограмма визначалися автоматично, як показано на рис.3.

Висновки: при виконанні лабораторної роботи були отримані навики побудови вибіркових функцій розподілу в MS Excel з використанням функції Частота() і інструмент Гистограмма з Пакета анализа, ознайомилися з методикою побудови гістограм з довільною і рівною шириною стовбців в середовищі MathCAD за допомогою функцій hist і histogram.


 

А также другие работы, которые могут Вас заинтересовать

35069. Післявоєнна відбудова народного господарства 41.5 KB
  Чоловіки пішли далі дорогами війни. За самовідданість у роки війни більше 300 трудящих району були нагороджені медаллю За доблесну працю у Великій Вітчизняній війні 19411945 р. Наслідки війни були трагічними вони давали про себе знати на кожному кроці.
35070. Наследственные аномалии сельскохозяйственных животных 203 KB
  4 Аномалии сельскохозяйственных животных обусловленные мутациями генов6 Аномалии у крупного рогатого скота.6 Аномалии у свиней8 Аномалии у лошадей.9 Аномалии у овец.
35071. ИСКУССТВО ПОДБОРА ПЕРСОНАЛА. Как оценить человека за час 995 KB
  Как же узнать кто из них соответствует этому определению а кто нет Существует множество подходов к подбору и оценке персонала и автор директор по персоналу компании Johnson Johnson рассматривает большинство из них. В последнее время все чаще появляются статьи о том что при оценке инвестиционных рисков и при определении рыночной стоимости компании анализируется команда: в ряде случаев только топменеджеры в ряде случаев команда полностью. В ситуации когда в компании нет специалиста отдела персонала никто не владеет приемами...
35072. s, p, d-элементы, имеющие биологическое значение 100.44 KB
  Na получают электролизом расплава хлорида натрия NaCl, с добавлением NаСl2, КСl и NaF для снижения температуры плавления электролита до 600°C. Аноды изготовлены из графита, катоды — из меди или железа. Электролиз расплава проводят в стальном электролизере с диафрагмой. Параллельно с Na электролизом получают Cl2
35073. Теория государства и права. Сборник статей 2.92 MB
  и права является как бы деятельностью второго порядка способом методом регуляции. Матузов вслед за многими другими авторами в своей работе призывает разграничивать понятия правовая коллизия и правовой конфликт указывая на то что конфликт это противоречие между людьми в отличие от коллизий представляющих собой противоречия между нормами права способные служить причиной поводом для конфликта. Она появилась еще во времена зарождения самого права.
35074. МОТИВАЦИЯ И СТИМУЛИРОВАНИЕ ПЕРСОНАЛА 2.48 MB
  В ней рассмотрены основные концепции и психологические аспекты мотивации труда методы стимулирования работников и мотивационные ресурсы управления организацией. Исследования мотивации труда проведенные автором на предприятиях различных форм собственности и сфер деятельности позволили ему предложить новую систему диагностики мотивации труда работников. Они позволят руководителям выбрать из многообразия ресурсов методов и схем управления наиболее близкую для себя систему формирования мотивационного механизма и учтя специфические...
35075. СПРАВОЧНИК ПО ОТДЕЛКЕ МЕБЕЛИ 6.11 MB
  При первом способе необходимое по расчету количество красителя 01 05 к массе лака рабочей вязкости предварительно растворяют в растворителе. Некоторые красители изменяют цвет под действием перекисных соединений содержащихся в полиэфирных лаках [43]. Ее изготовляют из суховальцованных паст СВП спирторастворимых красителей и нитролака. Грунтовку НЦ 0140 можно применять при отделке как полиэфирными так и нитроцеллюлозными лаками.
35076. Экономическое содержание налогов 33.93 KB
  а Государство и налоги б Влияние налогов на экономику и социальную жизнь . Налоги как основной источник образования государственных финансов через изъятие в виде обязательных платежей части общественного продукта известны с незапамятных времен. В разные времена и в разных странах налоги собирались различными способами. По этой причине налоги в истории всегда ассоциировались с несправедливостью.
35077. Змішана економіка та її типи 229 KB
  Змішана економіка та її типи План Сутність і ознаки змішаної економікиумови і принципи виникнення. Особливості становлення ринкової економіки в Україні. Моделі і шляхи переходу до ринкової економіки. Сутність і ознаки змішаної економікиумови і принципи виникнення.