14612
Проектування логічної структури сховища даних з архітектурою зведення даних
Лабораторная работа
Информатика, кибернетика и программирование
7 Лабораторна робота № 3 з дисципліни: Технології сховищ даних на тему: Проектування логічної структури сховища даних з архітектурою зведення даних Мета роботи: Вивчення порядку методів та засобів проектування і побудови сховища даних з ар...
Украинкский
2013-06-08
181.48 KB
11 чел.
7
Лабораторна робота № 3
з дисципліни:
«Технології сховищ даних»
на тему:
«Проектування логічної структури сховища даних з архітектурою зведення даних»
Мета роботи: Вивчення порядку, методів та засобів проектування і побудови сховища даних з архітектурою зведення даних та оцінка часу виконання запитів.
Теоретичні відомості
Зведення даних (Data Vault) (ЗД) предметно орієнтована, історична і унікально зв'язана множина нормалізованих таблиць, які підтримують одну або більше функціональних предметних областей. Це гібридний підхід, що поєднує кращі особливості 3-ої нормальної форми (3НФ) і схеми «зірка».
У лабораторінй роботі № 1 подано ориґінальну 3НФ модель, пристосовану до архітектури сховищ даних. Одна особливо складна проблема очевидна, коли значення часу-дати розміщена в первинному ключ таблиці батька (див рис. 1).
Якщо у таблицю батька додано новий запис, то ця зміна викликає примусове каскадування вниз через всі підлеглі табличні структури. Також, коли новий кортеж вставлений з наявним ключем батька (єдине поле зміни - мітка часу дати), всі кортежі-діти повинні бути переприсвоєні до нового ключа батька. Цей ефект каскадування стає все помітнішим при збільшенні кількості даних. Усе це призводить до неможливості підтримки роботи сховищ даних.
Рис 1. Використання часу у 3НФ.
Тому подальшим розвитком була схема «зірка», яка вимагала денормалізації, але водночас була краще пристосована до виконання аналітичних завдань. Модель «зірка» добре працює для швидкого подання багатовимірної інформації для певних груп кінцевих користувачів. Її перевагами є: багатовимірний аналіз, сумарні звіти (графи, пошук мінімуму, максимуму, зміна рівнів аґреґування). Проте, як виявилося, така модель не є гнучкою, оскільки її структура є незмінною, жорстко форматованою. Також вона не здатна забезпечити статистичний аналіз.
Схема «зірка» здатна до виконання операції «slice and dice» для окремого користувача або групи користувачів. Також недоліком є неможливість подання усього масиву інформації у вигляді довільних звітів. Нарешті, модель дуже надмірна і важка для здійснення змін у структурі.
Зведення даних передбачає певну нормалізацію даних, що видозмінена для потреб сховищ даних. Ця архітектура використовує такі модельовані методи: звязок багато-до-багатьох, цілісність звязків, мінімально надмірні набори даних. Ці методи роблять модель зведення даних гнучкою, поширюваною і послідовною.
На рис. 2 подано модель звязків між сутностями предметної області «Торговельна фірма», яка дозволяє перейти до моделі СД зведення даних.
Рис. 2. Схема зведення даних.
Компоненти зведення даних
Є мінімальний ряд компонентів архітектури зведення даних:
Заданий набір компонентів забезпечує максимальну гнучкість, обмежуючись традиційними підходами до моделювання.
Центральна таблиця являє собою таблицю з множиною унікальних ключів, що описують певну частину проблемної області. Вона складається з наступних атрибутів:
Таблиця звязку моделює зв'язок багато-до-багатьох на фізичному рівні між двома або більше центральними таблицями. Має наступні атрибути:
Таблиці-супутники містять описовий контекст екземплярів Hub або Link. Опис може змінюватися з часом і така сутність повинна вміти зберігати нові або змінені дані. Має обов'язкові атрибути:
Наявність таблиць центів (Hub) та таблиць звязків (Link) дозволяють зменшити розрідженість даних, яка виникає внаслідок багатовимірного подання інформації.
Також одним із підвидів ЗД є матрична методологія, яка розширена ще однією таблицею Малюнок (Picture) для фіксації історичності даних та історичності звязків. Приклад матричної методології до проектування сховищ даних подано на рис. 8.3.
Проектування на основі зведення даних передбачає такі етапи.
Рис. 8.3. Схема матричної ЗД.
Різниця між Satellite і Link полягає у тому, що Satellite має описовий характер, не містить зовнішніх ключів. Link описує функціональний зміст сутності, що дозволяє обмежувати період дії їх бізнес-процесів, переглядати вміст при зміні бізнесу.
Проектування за методологією ЗД вимагає дотримання таких правил.
Перед перетворенням сховища даних з іншою архітектурою в архітектуру з використанням ЗД необхідно дослідити наявні структури даних:
Можливі застосування зведення даних
Зведення даних може застосовуватись для різних предметних областей. Маленький список можливостей поданий нижче.
Хід роботи
use BetBattles
go
Одиничне додавання:
insert into Users([Login], [E-Mail], RegistrationDate, PasswordHash, PasswordSault, IsAdmin)
values ('admin', 'adminBetBattles@gmail.com', GETDATE(), 'qwertyuiopasdfghjklzxcvbnmlkjhgf', 123, 1);
go
Групове додавання:
insert into Users([Login], [E-Mail], RegistrationDate, PasswordHash, PasswordSault, [IsAdmin])
values ('admin2', 'admin2BetBattles@gmail.com', GETDATE(), 'q1wertyigoasdfghjklzxcvbnmlkjhgf', 123, 1),
('user1', 'ololo@mail.ru', GETDATE(), '627ertyuihjgsdfhjklxcfgtimlkjhgf', 89, 0),
('Chuck', 'chuck@google.com', GETDATE(), '787er93ihjgsdfgklzfxcutimlkjhgf', 42, 1);
go
Рис.1. Таблиця Users після виконання додавання
BULK
INSERT Groups
FROM 'D:\NULP\4Kurs2semestr\SUBD\groups.db'
WITH
(
FIELDTERMINATOR = '\t',
ROWTERMINATOR = '\n'
)
GO
BULK
INSERT Matches
FROM 'D:\NULP\4Kurs2semestr\SUBD\matches.db'
WITH
(
FIELDTERMINATOR = '\t',
ROWTERMINATOR = '\n'
)
GO
Рис.2. Таблиці Groups та Matches з доданими даними
Рис.3. Змінена таблиця Users
use BetBattles
go
UPDATE Users
SET IsAdmin = 1 - IsAdmin;
UPDATE Users
SET Login = Login + 'BetWarrior';
Рис. 4. Результат зміни даних у таблиці Users
use BetBattles
go
delete from Matches
where Date<='2012-02-25'
Рис. 4. Таблиця Matches після видалення даних
Висновок: Під час виконання даної лабораторної роботи, я вивчив порядок, методи та засоби проектування і побудови сховища даних з архітектурою зведення даних та способи оцінки часу виконання запитів.
А также другие работы, которые могут Вас заинтересовать | |||
30491. | Физиология высшей нервной деятельности | 26.62 KB | |
Кора большого мозга и подкорковые образования являются высшими отделами центральной нервной системы теплокровных животных и человека. Они обеспечивают рефлекторные реакции, за счет которых осуществляются сложнейшие взаимодействия человека и животных с окружающей средой. | |||
30492. | Перспективы информатизации регионального управления | 120.5 KB | |
История и специфика отдельных европейских стран обуславливают крайнее разнообразие систем их государственного устройства и управления вообще и места в них регионального звена в частности и в особенности. | |||
30493. | Основные технико-технологические проблемы разведки, освоения и эксплуатации нефтегазовых месторождений | 74 KB | |
Чтобы управлять технологическими процессами представляющими собой различные этапы (ступени) эксплуатации нефтегазовых месторождений, необходимо сначала изучить закономерности их поведения, а затем на основе имеющихся данных, которые характеризуют различные свойства изучаемого объекта (нефтегазового месторождения) | |||
30494. | Органеллы цитоплазмы: пластиды, как специфические органеллы растительной клетки | 42 KB | |
Пластиды встречаются только у растений. В зависимости от окраски различают три типа пластид: хлоропласты - зеленого цвета; хромопласты - желтого, оранжевого, красного цветов и лейкопласты - бесцветные. | |||
30495. | Современные геофизические методы как средство изучения строения и свойств геологической среды | 93.5 KB | |
Современные геофизические методы служат основой создания многопараметровой базы данных, как основы математического моделирования технологических процессов в нефтегазодобыче. | |||
30496. | ПРИМЕНЕНИЕ ГЕОФИЗИЧЕСКИХ МЕТОДОВ ПРИ ПОИСКАХ ЗОН ВЫКЛИНИВАНИЯ И РИФОВ | 1018.5 KB | |
Поиски залежей нефти и газа в литолого-стратиграфических ловушках являются в несколько раз менее эффективными, чем поиски месторождений на сводах антиклиналей. Это обусловлено в значительной мере ограниченными возможностями современных методов полевой геофизики в надежном выявлении таких ловушек. | |||
30498. | Многочлены. Кольцо многочленов над кольцом с единицей. Делимость многочленов, теорема о делении с остатком. Значение и корень многочлена. Теорема Безу | 57.56 KB | |
о делении мннов: 2ух мннов f и g≠0 мнны q и r такие что f=qgr причем или r=0 или degr degg.degrx degx а degx=1 degrx=0. Доказательство: Поделим с остатком многочлен fx на многочлен x: fx=xqxrx Так как degrx degx а degx=1 то rx многочлен степени не выше 0 т. Докво: единственность пусть где или deg degg то откуда следует но deg degg . | |||