36944

Побудова вибіркової функції розподілу засобами комп’ютерних технологій

Лабораторная работа

Информатика, кибернетика и программирование

Лабораторна робота №2 Тема: побудова вибіркової функції розподілу засобами компютерних технологій. У MthCD існують дві функції що дозволяють зробити обробку вибірки для наступної побудови гістограм. Оскільки методика створення гістограм з використанням функції hist досить складна надамо її по пунктах: Для початку представимо експериментальні дані у вигляді вектора.

Украинкский

2013-09-23

363.5 KB

9 чел.

Міністерство освіти і науки, молоді та спорту України

Національний транспортний університет

Факультет транспортних та інформаційних технологій

Кафедра інформаційних систем і технологій

Лабораторна робота №2

з дисципліни

«Комп’ютерні технології статистичної обробки інформації»

на тему

«Побудова вибіркової функції розподілу засобами комп’ютерних технологій»

 

Виконав:

Студент гр. КН-ІІІ-2

Дворник О.О.

Варіант – 5.

Перевірила:

доц. Парохненко Л.М.

Київ – 2011

Лабораторна робота №2

Тема: побудова вибіркової функції розподілу засобами комп’ютерних технологій.

Мета: ознайомитися з методикою побудови вибіркових функцій розподілу в Excel з використанням інструменту Гістограма з Пакету аналізу і навчитися побудови гістограм в середовищі MathCAD.

Теоретична довідка

  1.  Побудова гістограм.

Гістограма – це графік, що дозволяє візуалізувати відносну частоту влучення даних експериментальної вибірки у визначений числовий інтервал. При її побудові область, обумовлена по розмаху значень даних у вибірці, розбивається на деяке невелике (6-20) число проміжків (як правило, рівних), і потім підраховується відсоток елементів, влучивших до кожного з них. Сама гістограма являє собою стовпчасту діаграму, ширина сегмента якої відповідає величині проміжку, а висота – відносної частості влучення в нього даних. Проводячи паралелі, можна сказати, що в статистиці гістограма є повним аналогом кривої щільності розподілу в теорії імовірностей. Відповідно площа всіх її стовпців повинна бути нормована і дорівнювати 1.

Побудова гістограм вручну – трудомістка і непроста задача. У MathCAD же, завдяки наявності спеціальних функцій, вона вирішується досить легко. Більш того, художній рівень отриманих графіків заслуговує самих високих оцінок. З огляду на практичну важливість статистичних діаграм, розглянемо техніку їх створення.

  1.  Гістограми з довільною шириною стовпців.

У MathCAD існують дві функції, що дозволяють зробити обробку вибірки для наступної побудови гістограм. Перша з них, що з'явилася в ранніх версіях програми, функція hist (intvls,x), більш складна у використанні, однак при її допомозі можна будувати гістограми з нерівною шириною сегментів.

Функція hist (intvls,x) – вектор частоти попадання даних в інтервали гістограми:

  •  іntvls – вектор, елементи якого задають сегменти побудови гістограми в порядку зростання a<intvlsi<b;
  •  х – вектор випадкових даних.

Якщо вектор intvls має bin елементів, то і результат hist має стільки ж елементів. Оскільки методика створення гістограм з використанням функції hist досить складна, надамо її по пунктах:

  1.  Для початку представимо експериментальні дані у вигляді вектора. На практиці це робиться або безпосереднім їхнім занесенням у таблицю введення (Input Таble), або читанням з текстового або Excel файлу. Щоб одержати передбачуваний результат, скористаємося одним з генераторів випадкових чисел MathCAD. Наприклад, задамо вектор з 1000 нормально розподілених випадкових величин з математичним сподіванням µ=3 і середньоквадратичним відхилення σ = 1 :

  1.  Визначимо кількість стовпців майбутньої гістограми. У загальному випадку для цього можна скористатися спеціальною формулою, що обчислює верхню границю числа сегментів для коректної гістограми (утім, в MathCAD це можна зробити і довільним чином):

  1.  Далі обчислимо ширину сегментів гістограми. Зазвичай вона визначає відношення розмаху даних у вибірці до числа стовпців гістограми. У MathCAD розмах даних у векторі можна обчислити за допомогою спеціальних матричних функцій max(х) і min(х), що повертають, відповідно, найбільший і найменший його елемент. Щоб обчислити крок сегмента максимально коректно, граничні значення варто округлити. Для цього можна використовувати спеціальні функції floor(a) і ceil(a), що підраховують верхню і нижню границі округлення для числа а:

  1.  Використовуючи ранжовану змінну, задаємо вектор границь сегментів розбивки. У загальному випадку його можна визначити довільним чином. Але оскільки на практиці гістограми будуються практично винятково зі стовпцями рівної ширини, то і наш вектор задамо таким чином, щоб різниця між його сусідніми елементами дорівнювала по величині визначеному вище кроку:

  1.  За допомогою функції hist обчислюємо вектор, що містить як елемент кількість влучень у відповідний сегмент даних з досліджуваної вибірки. Ширина ж самих стовпців визначається цією функцією як різниця між сусідніми елементами заданого вище вектора t:

  1.  Виходячи з математичного змісту гістограми, розраховуємо на основі вектора f вектор частостей влучення даних у відповідні сегменти:

Враховувати величину кроку step у проведеній процедурі необхідно в зв'язку з умовою нормування (до речі, зверніть увагу, що використана формула є аналогом формули щільності імовірності, що застосовується в теорії ймовірностей).

  1.  Оскільки стовпці гістограми будуються виходячи з тієї умови, що елементи вектора t повинні відповідати їх серединам, проведемо його перевизначення:

 

Результат роботи:

Оскільки, стовпці гістограми будуються виходячи з того, що елементи вектора t повинні відповідати їх серединам, проведемо його перевизначення:

  1.  Побудова гістограми з рівною шириною стовпців.

Великим недоліком функції hist є те, що для неї необхідно задавати вектор, що містить значення границь сегментів. Функція, що з'явилася в останній версії програми, histogram(bin,x) цю частину роботи бере на себе.

Щоб побудувати гістограму за допомогою функції histogram (bin,x), потрібно визначитися з числом сегментів bin. Їхні границі і середини, які необхідні для розрахунку функція визначить сама.

Результатом роботи функції histogram є матриця розмірності binх2, у першому стовпці якої отримуються значення середин сегментів розбивки, у другому – число елементів вибірки, що потрапили на кожний з інтервалів. У найпростішому випадку, якщо нас цікавить тільки форма розподілу, ми можемо побудувати гістограму, виділивши за допомогою спеціального оператора ([Ctrl]+[6]) вектори відповідних координат з даної матриці. Однак для побудови коректного графіка все ж таки необхідно провести нормування.

Результат роботи:

  1.   Побудова вибіркової функції розподілу засобами Excel.

Для побудови вибіркової функції розподілу увесь діапазон зміни випадкової величини X розбивають на ряд інтервалів однакової ширини. Число інтервалів зазвичай вибирають не менше 5 і не більше 15. Потім визначають число значень випадкової величини X, що потрапила в кожен інтервал. Поділивши ці числа на загальну кількість спостережень n, знаходять відносну частоту попадання випадкової величини X в задані інтервали. По знайдених відносних частотах будують гістограми вибіркових функцій розподілу. Якщо відповідні точки відносних частот з'єднати ламаною лінією, то отримана діаграма називатиметься полігоном частот. Кумулятивна крива буде отримана, якщо по осі абсцис відкладати інтервали, а по осі ординат − число або долі елементів сукупності, що мають значення, менше або рівне заданому.

При збільшенні до безкінечності розміру вибірки вибіркові функції розподілу перетворюються на теоретичні: гістограма перетворюється на графік щільності розподілу, а кумулятивна крива − в графік функції розподілу.

У Excel для побудови вибіркових функцій розподілу використовуютьcя спеціальна функція ЧАСТОТА і процедура пакету аналізу Гистограмма.

  •  Функція ЧАСТОТА обчислює частоти появи випадкової величини в інтервалах значень і виводить їх як масив цифр. Функція задається в якості формули масиву.

Частота(масив_даных;масив_карманов).

Результат роботи:

 

Рис.1. Гістограма для функції Частота.

  •   Процедура Гистограмма використовується для обчислення вибіркових та інтегральних частот попадання даних у вказані інтервали значень. Процедура виводить результати у вигляді таблиці і гістограми.

Рис.2. Діалогове вікно процедури Гистограмма.

Результат роботи:

  1.  з порожнім полем Интервал карманов:

Рис.3. Гістограма для процедури Гистограмма з порожнім полем Интервал карманов.

  1.  із заповненим полем Интервал карманов:

Рис.4. Гістограма для процедури Гистограмма із заповненим полем Интервал карманов.

Як ми бачимо, гістограма на рис.4 дуже схожа на діаграму на рис.1. Це пояснюється тим, що був введений діапазон карманів. Інакше, кількість і границі інтервалів в процедурі Гистограмма визначалися автоматично, як показано на рис.3.

Висновки: при виконанні лабораторної роботи були отримані навики побудови вибіркових функцій розподілу в MS Excel з використанням функції Частота() і інструмент Гистограмма з Пакета анализа, ознайомилися з методикою побудови гістограм з довільною і рівною шириною стовбців в середовищі MathCAD за допомогою функцій hist і histogram.


 

А также другие работы, которые могут Вас заинтересовать

35131. Форматирование результатов запроса 82 KB
  Например можно применить следующую команду чтобы увидеть определенные поля таблицы Slespeople упорядоченные по убыванию поля commission comm: SELECT snme comm FROM Slespeople ORDER BY 2 DESC; Мы рассматриваем это свойство ORDER BY для того чтобы продемонстрировать возможность его использования со столбцами выходных данных; эта процедура аналогична применению ORDER BY со столбцами таблицы. Например чтобы подсчитать заявки orders для каждого продавца slespeople и вывести результаты в убывающем порядке: SELECT snum COUNT DISTINCT...
35132. Создание таблиц 90 KB
  Команда CRETE TBLE Таблицы определяются с помощью команды CRETE TBLE создающей пустую таблицу таблицу не имеющую строк. Команда CRETE TBLE определяет имя таблицы и множество поименованных столбцов в указанном порядке. Синтаксис команды CRETE TBLE: CRETE TBLE имя таблицы имя столбца тип данных [ размер ] имя столбца тип данных [ размер ]. Поскольку пробелы используются для разделения отдельных частей команд в SQL их нельзя использовать как часть имени таблицы.
35133. Основные понятия SQL 152.5 KB
  Он используется для связи с такими системами управления базами данных как Orcle INGRES Informix Sybse SQLbse Microsoft SQL Server DB2 СУБД самой IBM продуктами SQL DC Prdox ccess pproch и многими другими. Обычно продукт базы данных включает не только СУБД. Собственно СУБД иногда ее называют исполнительной системой или исполнительным механизмом базы данных является рабочей лошадкой продукта. Она хранит данные осуществляет поиск и выборку данных а также записывает данные посредством исполнения операторов SQL В вычислительной...
35134. Альтернативная программная реализация выборки и модификации данных в базе данных Interbase 34.5 KB
  Конфигурируется ODBCисточник реализующий доступ к БД Interbse. В DBE dministrtor настраивается псевдоним БД доступной через BDE и представляющей собой в данном случае ODBCисточник. В отличие от 3го способа являющегося усовершенствованным подходом BDE 1й способ является более универсальным и более ресурсоемким в первую очередь по критерию времени поскольку представляет собой использование промежуточного уровня BDE и промежуточного уровня ODBC а 2й менее универсальным и менее ресурсоемким поскольку предполагает использование...
35135. Пример реализации трехзвенной архитектуры 39.5 KB
  Два разрабатываемых при этом программных компонента это сервер приложений и клиент взаимодействующие по протоколу DCOM. Разработка сервера приложений Основные шаги создания сервера приложений: Создание удаленного модуля данных Remote Dt Module. Однократный запуск программы с целью регистрации сервера приложений в реестре Windows. Для распределенного использования разработанных клиентского и серверного приложений требуется установка некоторых дополнительных программных компонент.
35136. Пример реализации обмена данными с Microsoft Excel 45.5 KB
  Создание новой книги Vrint MSBooks; MSBooks = MSExcel. Создание нового листа книги. Сохранение книги. Создание нового листа книги.
35137. Изучение формата баз данных Visual FoxPro 549.5 KB
  После заголовка таблицы следует цепочка 32байтовых описаний полей таблица 4.fmp Fp 01 1 YY Год последнего обновления таблицы Все 02 1 MM Месяц последнего обновления таблицы Все 03 1 DD День последнего обновления таблицы Все 04 4 RecordsCount Количество записей в таблице Все 08 2 HederSize Размер заголовка в байтах Все 10 2 RecordSize Размер записи в байтах Все 12 2 0x000x00 Зарезервировано Все 14 1 0x01 Начало транзакции D4 D5 0x00 Конец транзакции D4 D5 0x00 Игнорируется FS D3 Fb Fp CL 15 1 0x01 Закодировано D4 D5 0x00 Нормальная...
35138. Разработка файл-серверной информационной системы с использованием технологий Borland 47.5 KB
  Программное использование БД Простейший случай Для обращения к таблицам используются невизуальные компоненты TTble и TDtSource закладки Dt ccess и BDE палитры компонентов и ряд визуальных: TDBGrid TDBEdit TDBLookupComboBox и т. В компоненте TTble устанавливаются свойства TbleNme TbleType. В последнем случае псевдоним БД указывается в свойстве DtbseNme объекта TTble. В компоненте TDtSource устанавливается свойство DtSet как указатель на TTble.
35139. Поддержка сложных запросов в файл-серверной информационной системе с использованием технологий Borland 59.5 KB
  Способным работать независимо от того отсутствуют ли требуемые таблицы или наличествуют и заполнены данными. Например: SELECT fio FROM stud; выборка поля fio из всех записей таблицы stud SELECT fio n_spect FROM stud; выборка полей fio n_spect из таблицы stud SELECT FROM stud; выборка всех полей из таблицы stud SELECT s. FROM stud S s; выборка всех полей из таблицы stud с присваиванием таблице псевдонима s SELECT s.n_spect S spect FROM stud S s; выборка из таблицы stud полей fio и n_spect с присваиванием им...