70610

Проектирование хранилищ данных

Лекция

Информатика, кибернетика и программирование

При проектировании хранилищ данных необходимо выполнять следующие требования: хранилище должно иметь понятную для пользователей структуру данных; должны быть выделены статические данные которые модифицируются по расписанию ежедневно еженедельно ежеквартально...

Русский

2014-10-23

40.57 KB

5 чел.

Лекция 39

Проектирование хранилищ данных

В хранилища данных помещают данные, которые редко меняются. Хранилища ориентированы на выполнение аналитических запросов, обеспечивающих поддержку принятия решений для руководителей и менеджеров. При проектировании хранилищ данных необходимо выполнять следующие требования:

  1.  хранилище должно иметь понятную для пользователей структуру данных;
  2.  должны быть выделены статические данные, которые модифицируются по расписанию (ежедневно, еженедельно, ежеквартально);
  3.  должны быть упрощены требования к запросам для исключения запросов, требующих множественных утверждений SQL в традиционных реляционных СУБД;
  4.  должна обеспечиваться поддержка сложных запросов SQL, требующих обработки миллионов записей.

Как видно из этих требований, по своей структуре реляционные СУБД существенно отличаются от хранилищ данных. Нормализация данных в реляционных СУБД приводит к созданию множества связанных между собой таблиц. Выполнение сложных запросов неизбежно приводит к объединению многих таблиц, что значительно увеличивает время отклика. Проектирование хранилища данных подразумевает создание денормализованной структуры данных, ориентированных в первую очередь на высокую производительность при выполнении аналитических запросов. Нормализация делает модель хранилища слишком сложной, затрудняет ее понимание и снижает скорость выполнения запроса. Для эффективного проектирования хранилищ данных ERwin использует размерную модель – методологию проектирования, предназначенную специально для разработки хранилищ данных. Размерное моделирование сходно с моделированием связей и сущностей для реляционной модели, но имеет другую цель. Реляционная модель акцентируется на целостности и эффективности ввода данных. Размерная модель ориентирована в первую очередь на выполнение сложных запросов

В размерном моделировании принят стандарт модели, называемый схемой "звезда", которая обеспечивает высокую скорость выполнения запроса посредством денормализации и разделения данных. Невозможно создать универсальную структуру данных, обеспечивающую высокую скорость обработки любого запроса, поэтому схема "звезда" строится для обеспечения наивысшей производительности при выполнении самого важного запроса (или группы запросов).

Схема "звезда" обычно содержит одну большую таблицу, называемую таблицей факта, помещенную в центре. Ее окружают меньшие таблицы, называемые таблицами размерности, которые связаны с таблицей факта радиальными связями.

Для создания БД со схемой "звезда" необходимо проанализировать бизнес-правила предметной области для выяснения центрального запроса. Данные, обеспечивающие выполнение этого запроса, должны быть помещены в центральную таблицу. При проектировании хранилища важно определить источник данных, метод, которым данные извлекаются, преобразуются и фильтруются, прежде чем они импортируются в хранилище. Знания об источнике данных позволяют поддерживать регулярное обновление и проверку качества данных.

Вычисление размера БД

ERwin позволяет рассчитать приблизительный размер БД в целом, а также таблиц, индексов и других объектов через определенный период времени после начала эксплуатации ИС. Расчет строится на основе следующих параметров: начальное количество строк; максимальное количество строк; прирост количества строк в месяц. Результаты расчетов сводятся в отчет.

Прямое и обратное проектирование

Прямым проектированием называется процесс генерации физической схемы БД из логической модели. При генерации физической схемы ERwin включает триггеры ссылочной целостности, хранимые процедуры, индексы, ограничения и другие возможности, доступные при определении таблиц в выбранной СУБД.

Обратным проектированием называется процесс генерации логической модели из физической БД. Обратное проектирование позволяет конвертировать БД из одной СУБД в другую. После создания логической модели БД путем обратного проектирования можно переключиться на другой сервер и произвести прямое проектирование.

Кроме режима прямого и обратного проектирования программа обеспечивает синхронизацию между логической моделью и системным каталогом СУБД на протяжении всего жизненного цикла создания ИС.

Генерация кода клиентской части с помощью ERwin

Расширенные атрибуты

ERwin поддерживает не только проектирование сервера БД, но и автоматическую генерацию клиентского приложения в средах разработки MS Visual Basic и Power Builder. Технология генерации состоит в том, что на этапе разработки физической модели данных каждой колонке присваиваются расширенные атрибуты, содержащие информацию о свойствах объектов клиентского приложения (в том числе и визуальных), которые будут отображать информацию, хранящуюся в соответствующей колонке. Эта информация записывается в файле модели. На основе информации, содержащейся в расширенных атрибутах, генерируются экранные формы. Полученный код может быть откомпилирован и выполнен без дополнительного ручного кодирования.

Каждой колонке в модели ERwin можно задать предварительно описанные и именованные свойства:

  1.  правила валидации (проверка значений);
  2.  начальные значения, устанавливаемые по умолчанию;
  3.  стиль визуального объекта (например, радиокнопка, поле ввода и др.);
  4.  формат изображения.

Для описания каждого свойства ERwin содержит соответствующие редакторы.

Генерация кода в Visual Basic

ERwin поддерживает генерацию кода в Visual Basic версий 4.0 и 5.0. В качестве источника информации при генерации форм служит модель ERwin. С помощью ERwin можно одновременно описывать как клиентскую часть (объекты, отображающие данные на экране), так и сервер БД (процедуры и триггеры ), тем самым оптимально распределяя функциональность ИС между клиентской и серверной частью. Компонент ERwin Form Wizard автоматически проектирует формы с дочерними объектами – кнопками, списками, полями, радиокнопками и т. д., используя расширенные атрибуты. Совместное использование ERwin и Visual Basic позволяет сократить жизненный цикл разработки ИС путем употребления для каждой задачи наиболее эффективного инструмента. Visual Basic может быть использован для проектирования визуального интерфейса, а ERwin – для разработки физической и логической модели данных с последующей генерацией системного каталога сервера. Если БД уже существует, то с помощью ERwin можно провести обратное проектирование, полученную модель дополнить расширенными атрибутами и сгенерировать клиентское приложение.

Создание отчетов

Для генерации отчетов в ERwin имеется простой и эффективный инструмент – Report Browser. По умолчанию Report Browser содержит предварительно определенные отчеты, позволяющие наглядно представить информацию об основных объектах модели данных – как логической, так и физической. С помощью специального редактора существующие отчеты можно изменить или создать собственный отчет. Каждый отчет может быть настроен индивидуально, данные в нем могут быть отсортированы и отфильтрованы. Browser Report позволяет сохранять результаты выполнения отчетов, печатать и экспортировать их в распространенные форматы.

Генерация словарей

Для управления большими проектами ERwin имеет специальный инструмент – ERwin Dictionary, который обеспечивает коллективную работу над диаграммами и позволяет сохранять и документировать различные версии моделей данных. ERwin Dictionary представляет собой специальную БД, которая позволяет решить проблемы документирования и хранения моделей, однако не полностью отвечает требованиям многопользовательской работы.


 

А также другие работы, которые могут Вас заинтересовать

42195. Калібрування і повірка засобів вимірювання тиску 86 KB
  1 Мета роботи Ознайомитись з будовою і принципом дії технічних засобів для вимірювання тиску. Набути практичних навиків при повірці і калібруванні систем вимірювання тиску.2 Програма роботи Під час заняття студент повинен самостійно ознайомитись з будовою і принципом дії технічних засобів які використовуються в системах для вимірювання тиску.
42196. Обробка результатів прямих багаторазових вимірювань 263.5 KB
  Вивчення методів і набуття практичних навиків в обробці результатів багаторазових вимірювань які містять випадкові похибки. Програма роботи Під час роботи студенти вимірюють активні опори за допомогою універсального цифрового вимірювача Ф 480 так щоб досягти при цьому одержання найбільш точних результатів шляхом визначення і виключення систематичних і випадкових похибок вимірювань параметра з рівноточними значеннями відліку. З цією метою використовується методика багатократного вимірювання однієї і тієї ж величини з...
42197. Вивчення будови, принципу дії амперметрів та вольтметрів. Визначення їх метрологічних характеристик 93 KB
  Якщо статична характеристика лінійна у=кх то коефіцієнт к називається чутливістю вимірювального приладу; ціна поділки ЗВ ; ціна одиниці найменшого розряду числа в показах цифрового приладу ; 2 похибки ЗВ: Абсолютна відносна приведена похибки ЗВ; Похибки поділяються на статичні які виникають при вимірюванні постійних величин динамічні які виникають при вимірюванні змінних величин. До числа характеристик похибок відноситься також варіація вихідного сигналу або варіація показів вимірювального приладу.8485]: метод порівняння з...
42198. Повiрка цифрових та аналогових омметрiв 144.5 KB
  Програма роботи У процесі підготовки до заняття студенту потрібно ознайомитись з методикою повірки омметрів згідно ГОСТ 9. Здійснити повірку цифрових універсальних омметрів типу В7 20 та В7 16А.1 Будова аналогових омметрів Омметрами називають прилади прямої дії які служать для безпосереднього вимірювання активних опорів. Перевага двохрамочних омметрів у тому що їх покази не залежать від напруги джерела живлення.
42199. Калібрування і повірка термометрів опору 286.5 KB
  Засвоїти методику отримання практичних навиків при проведенні досліджень динамічних характеристик термометрів опору при нагріванні і охолодженні повірці термометрів опору та калібруванні напівпровідникових термометрів опору термісторів.2 Програма роботи Під час заняття студент повинен ознайомитись з будовою та принципом дії термометрів опору. Визначити динамічну похибку термометрів опору типу ТСП і ТСМ.
42200. Систематичні похибки вимірювань та методи їх зменшення 71.5 KB
  У процесі заняття провести вимірювання різних електричних величин різними способами і засобами визначити систематичні похибки ввести поправки до результатів вимірювань обчислити дійсні значення вимірюваних величин і впевнитись у правильності отриманих значень.1 Систематичні похибки вимірювань та методи їх зменшення Процес пізнання матеріального світу відбувається через експериментальне визначення вимірювання кількісних оцінок фізичних величин що характеризують досліджувані процеси явища. Таким чином результат...
42201. Вивчення будови, принципу дії та застосування електронного осцилографа для електричних вимірювань 461 KB
  Практичне виконання вимiрювань напруги струму часових iнтервалiв частоти кута зсуву фаз складової комплексного опору та iнших електричних величин з допомогою осцилографа. При пiдготовцi до роботи студенти повиннi самостiйно продумати i завчасно пiдготувати програму виконання роботи для заданого їм варiанта вибрати або скласти самостiйно необхiднi для цього схеми вимiрювань запропонувати свої рiшення в здiйсненнi вимiрювань дiючих значень синусоїдальних струмiв i напруг з допомогою осцилографа. Пропонується продумати методику...
42202. Вивчення методів та засобів вимірювання електричної ємності та індуктивності 245 KB
  Ознайомлення з різними методами вимірювання електричної ємності і індуктивності та приладами що використовуються для цього. Ознайомлення з будовою мостів змінного струму і універсальних мостів з будовою і застосуванням резонансних вимірювачів індуктивності L і ємності С. Отримання навичок практичного виконання вимірювань ємності і індуктивності.
42203. Електронні автоматичні мости і їх повірка 109 KB
  За результатами повірки зробити висновки про придатність до експлуатації автоматичного моста.3 Основні теоретичні відомості Електронні автоматичні мости Як правило термометри опору працюють в комплекті зі зрівноваженими електронними автоматичними мостами постійного або змінного струму або з логометрами. В автоматичних мостах використовується вимірювальна система чотириплечового моста з реохордом що забезпечує високу точність вимірювання. Термометр опору який є чутливим елементом моста включається в одне з його плечей.