36944

Побудова вибіркової функції розподілу засобами комп’ютерних технологій

Лабораторная работа

Информатика, кибернетика и программирование

Лабораторна робота №2 Тема: побудова вибіркової функції розподілу засобами компютерних технологій. У MthCD існують дві функції що дозволяють зробити обробку вибірки для наступної побудови гістограм. Оскільки методика створення гістограм з використанням функції hist досить складна надамо її по пунктах: Для початку представимо експериментальні дані у вигляді вектора.

Украинкский

2013-09-23

363.5 KB

9 чел.

Міністерство освіти і науки, молоді та спорту України

Національний транспортний університет

Факультет транспортних та інформаційних технологій

Кафедра інформаційних систем і технологій

Лабораторна робота №2

з дисципліни

«Комп’ютерні технології статистичної обробки інформації»

на тему

«Побудова вибіркової функції розподілу засобами комп’ютерних технологій»

 

Виконав:

Студент гр. КН-ІІІ-2

Дворник О.О.

Варіант – 5.

Перевірила:

доц. Парохненко Л.М.

Київ – 2011

Лабораторна робота №2

Тема: побудова вибіркової функції розподілу засобами комп’ютерних технологій.

Мета: ознайомитися з методикою побудови вибіркових функцій розподілу в Excel з використанням інструменту Гістограма з Пакету аналізу і навчитися побудови гістограм в середовищі MathCAD.

Теоретична довідка

  1.  Побудова гістограм.

Гістограма – це графік, що дозволяє візуалізувати відносну частоту влучення даних експериментальної вибірки у визначений числовий інтервал. При її побудові область, обумовлена по розмаху значень даних у вибірці, розбивається на деяке невелике (6-20) число проміжків (як правило, рівних), і потім підраховується відсоток елементів, влучивших до кожного з них. Сама гістограма являє собою стовпчасту діаграму, ширина сегмента якої відповідає величині проміжку, а висота – відносної частості влучення в нього даних. Проводячи паралелі, можна сказати, що в статистиці гістограма є повним аналогом кривої щільності розподілу в теорії імовірностей. Відповідно площа всіх її стовпців повинна бути нормована і дорівнювати 1.

Побудова гістограм вручну – трудомістка і непроста задача. У MathCAD же, завдяки наявності спеціальних функцій, вона вирішується досить легко. Більш того, художній рівень отриманих графіків заслуговує самих високих оцінок. З огляду на практичну важливість статистичних діаграм, розглянемо техніку їх створення.

  1.  Гістограми з довільною шириною стовпців.

У MathCAD існують дві функції, що дозволяють зробити обробку вибірки для наступної побудови гістограм. Перша з них, що з'явилася в ранніх версіях програми, функція hist (intvls,x), більш складна у використанні, однак при її допомозі можна будувати гістограми з нерівною шириною сегментів.

Функція hist (intvls,x) – вектор частоти попадання даних в інтервали гістограми:

  •  іntvls – вектор, елементи якого задають сегменти побудови гістограми в порядку зростання a<intvlsi<b;
  •  х – вектор випадкових даних.

Якщо вектор intvls має bin елементів, то і результат hist має стільки ж елементів. Оскільки методика створення гістограм з використанням функції hist досить складна, надамо її по пунктах:

  1.  Для початку представимо експериментальні дані у вигляді вектора. На практиці це робиться або безпосереднім їхнім занесенням у таблицю введення (Input Таble), або читанням з текстового або Excel файлу. Щоб одержати передбачуваний результат, скористаємося одним з генераторів випадкових чисел MathCAD. Наприклад, задамо вектор з 1000 нормально розподілених випадкових величин з математичним сподіванням µ=3 і середньоквадратичним відхилення σ = 1 :

  1.  Визначимо кількість стовпців майбутньої гістограми. У загальному випадку для цього можна скористатися спеціальною формулою, що обчислює верхню границю числа сегментів для коректної гістограми (утім, в MathCAD це можна зробити і довільним чином):

  1.  Далі обчислимо ширину сегментів гістограми. Зазвичай вона визначає відношення розмаху даних у вибірці до числа стовпців гістограми. У MathCAD розмах даних у векторі можна обчислити за допомогою спеціальних матричних функцій max(х) і min(х), що повертають, відповідно, найбільший і найменший його елемент. Щоб обчислити крок сегмента максимально коректно, граничні значення варто округлити. Для цього можна використовувати спеціальні функції floor(a) і ceil(a), що підраховують верхню і нижню границі округлення для числа а:

  1.  Використовуючи ранжовану змінну, задаємо вектор границь сегментів розбивки. У загальному випадку його можна визначити довільним чином. Але оскільки на практиці гістограми будуються практично винятково зі стовпцями рівної ширини, то і наш вектор задамо таким чином, щоб різниця між його сусідніми елементами дорівнювала по величині визначеному вище кроку:

  1.  За допомогою функції hist обчислюємо вектор, що містить як елемент кількість влучень у відповідний сегмент даних з досліджуваної вибірки. Ширина ж самих стовпців визначається цією функцією як різниця між сусідніми елементами заданого вище вектора t:

  1.  Виходячи з математичного змісту гістограми, розраховуємо на основі вектора f вектор частостей влучення даних у відповідні сегменти:

Враховувати величину кроку step у проведеній процедурі необхідно в зв'язку з умовою нормування (до речі, зверніть увагу, що використана формула є аналогом формули щільності імовірності, що застосовується в теорії ймовірностей).

  1.  Оскільки стовпці гістограми будуються виходячи з тієї умови, що елементи вектора t повинні відповідати їх серединам, проведемо його перевизначення:

 

Результат роботи:

Оскільки, стовпці гістограми будуються виходячи з того, що елементи вектора t повинні відповідати їх серединам, проведемо його перевизначення:

  1.  Побудова гістограми з рівною шириною стовпців.

Великим недоліком функції hist є те, що для неї необхідно задавати вектор, що містить значення границь сегментів. Функція, що з'явилася в останній версії програми, histogram(bin,x) цю частину роботи бере на себе.

Щоб побудувати гістограму за допомогою функції histogram (bin,x), потрібно визначитися з числом сегментів bin. Їхні границі і середини, які необхідні для розрахунку функція визначить сама.

Результатом роботи функції histogram є матриця розмірності binх2, у першому стовпці якої отримуються значення середин сегментів розбивки, у другому – число елементів вибірки, що потрапили на кожний з інтервалів. У найпростішому випадку, якщо нас цікавить тільки форма розподілу, ми можемо побудувати гістограму, виділивши за допомогою спеціального оператора ([Ctrl]+[6]) вектори відповідних координат з даної матриці. Однак для побудови коректного графіка все ж таки необхідно провести нормування.

Результат роботи:

  1.   Побудова вибіркової функції розподілу засобами Excel.

Для побудови вибіркової функції розподілу увесь діапазон зміни випадкової величини X розбивають на ряд інтервалів однакової ширини. Число інтервалів зазвичай вибирають не менше 5 і не більше 15. Потім визначають число значень випадкової величини X, що потрапила в кожен інтервал. Поділивши ці числа на загальну кількість спостережень n, знаходять відносну частоту попадання випадкової величини X в задані інтервали. По знайдених відносних частотах будують гістограми вибіркових функцій розподілу. Якщо відповідні точки відносних частот з'єднати ламаною лінією, то отримана діаграма називатиметься полігоном частот. Кумулятивна крива буде отримана, якщо по осі абсцис відкладати інтервали, а по осі ординат − число або долі елементів сукупності, що мають значення, менше або рівне заданому.

При збільшенні до безкінечності розміру вибірки вибіркові функції розподілу перетворюються на теоретичні: гістограма перетворюється на графік щільності розподілу, а кумулятивна крива − в графік функції розподілу.

У Excel для побудови вибіркових функцій розподілу використовуютьcя спеціальна функція ЧАСТОТА і процедура пакету аналізу Гистограмма.

  •  Функція ЧАСТОТА обчислює частоти появи випадкової величини в інтервалах значень і виводить їх як масив цифр. Функція задається в якості формули масиву.

Частота(масив_даных;масив_карманов).

Результат роботи:

 

Рис.1. Гістограма для функції Частота.

  •   Процедура Гистограмма використовується для обчислення вибіркових та інтегральних частот попадання даних у вказані інтервали значень. Процедура виводить результати у вигляді таблиці і гістограми.

Рис.2. Діалогове вікно процедури Гистограмма.

Результат роботи:

  1.  з порожнім полем Интервал карманов:

Рис.3. Гістограма для процедури Гистограмма з порожнім полем Интервал карманов.

  1.  із заповненим полем Интервал карманов:

Рис.4. Гістограма для процедури Гистограмма із заповненим полем Интервал карманов.

Як ми бачимо, гістограма на рис.4 дуже схожа на діаграму на рис.1. Це пояснюється тим, що був введений діапазон карманів. Інакше, кількість і границі інтервалів в процедурі Гистограмма визначалися автоматично, як показано на рис.3.

Висновки: при виконанні лабораторної роботи були отримані навики побудови вибіркових функцій розподілу в MS Excel з використанням функції Частота() і інструмент Гистограмма з Пакета анализа, ознайомилися з методикою побудови гістограм з довільною і рівною шириною стовбців в середовищі MathCAD за допомогою функцій hist і histogram.


 

А также другие работы, которые могут Вас заинтересовать

21311. Туннелирование 63 KB
  Сложность современных систем такова что без правильно организованного управления они постепенно деградируют как в плане эффективности так и в плане защищенности. Системы управления должны: позволять администраторам планировать организовывать контролировать и учитывать использование информационных сервисов; давать возможность отвечать на изменение требований; обеспечивать предсказуемое поведение информационных сервисов; обеспечивать защиту информации.700 выделяется пять функциональных областей управления: управление конфигурацией...
21312. Основные определения и критерии классификации угроз 87.5 KB
  Попытка реализации угрозы называется атакой а тот кто предпринимает такую попытку злоумышленником. Потенциальные злоумышленники называются источниками угрозы. Отметим что некоторые угрозы нельзя считать следствием какихто ошибок или просчетов; они существуют в силу самой природы современных ИС. Рассмотрим наиболее распространенные угрозы которым подвержены современные информационные системы.
21313. Хакерские атаки 928 KB
  Термин хакер здесь используется в его современном значении человек взламывающий компьютеры. Надо заметить что раньше быть хакером не считалось чемто противозаконным скорее это была характеристика человека умеющего профессионально обращаться с компьютерами. В наши дни хакерами мы называем тех кто ищет пути вторжения в компьютерную систему или выводит ее из строя.
21314. USING CONTEXT DATA IN INFORMATION RETRIEVAL 21 KB
  Proposed approach can be easily included in current search engines. This approach is not a complete alternative to classic methods applied in popular search engines, but it can be treated as an additional improvement that provides more efficient way in positioning on relevant document.
21315. Понятие электронно-цифровой подписи 38 KB
  Эта проблема решается при помощи ЭЦП. ЭЦП связывает содержимое документа и идентификатор подписывающего лица делает невозможным изменение документа без нарушения подлинности подписи и подтверждает принадлежность ЭЦП автору электронного документа. Алгоритмы формирования и проверки ЭЦП реализованы в соответствии с требованиями ГОСТ Р 34. ЭЦП Sign представляет собой вычисляемую по стандартизованному алгоритму математическую функцию хэшфункцию от содержимого подписываемых данных data информации документа и закрытого секретного ключа...
21316. Юридические вопросы информационной безопасности 202.5 KB
  Независимо от способа совершения компьютерного преступления его исполнители должны быть наказаны и профессионалы работающие в сфере информационной безопасности должны уметь собирать информацию необходимую правоохранительным органам при задержании и вынесении приговора лицам несущим ответственность за это преступление. В новом законодательстве нашли отражение вопросы безопасности финансовой информации о клиентах и конфиденциальности сведений медицинского характера. Все эти проблемы требуют понимания и изучения профессионалами работающими...
21317. Состав текущих затрат, сформированный в зависимости от производственно-хозяйственных целей предприятия РГБ 195.5 KB
  Все затраты на производство и реализацию продукции (работ, услуг) должны быть документально обоснованы и иметь исключительно целевое назначение. Поскольку издержки производства и обращения являются главной составляющей при расчете прибыли организации, они участвуют в расчете налогооблагаемой прибыли...
21318. Категории атак на информацию 317.5 KB
  Существуют четыре основных категории атак: атаки доступа; атаки модификации; атаки на отказ в обслуживании; атаки на отказ от обязательств. Атаки такого рода наиболее разрушительны. Атаки нацеленные на захват информации хранящейся в электронном виде имеют одну интересную особенность: информация не похищается а копируется. Определение атаки доступа Атака доступа это попытка получения злоумышленником информации для просмотра которой у него нет разрешений.
21319. Предмет і завдання екології. Місце екології у системі інших наук. Значення екології для людської цивілізації. Глобальні проблеми екології 56 KB
  З розвитком виробництва очевидною стає обмеженість традиційно використовуваних природних багатств суші, тому в наш час перспективи розвитку виробництва все в більшій мірі звязують з використанням ресурсів Світового океану та космічного простору. Тому можна сказати, що в наш час екологічні проблеми поширилися навіть за межі Землі.