27147

Комбинация многомерного и реляционного подхода: киоски (витрины) данных

Доклад

Информатика, кибернетика и программирование

Преимущества реляционных ХД: неограниченный объем хранения данных т. РСУБД лежат в основе большинства OLTP систем а те в свою очередь являются основным источником данных для хранилищ то упрощена загрузка данных в ХД OLTP Online Transaction Processing транзакционная система обработка транзакций в реальном времени. OLTPсистемы предназначены для ввода структурированного хранения и обработки информации операций документов в режиме реального времени при добавлении новых изменений не нужно выполнять сложную физическую реорганизацию...

Русский

2013-08-19

39.38 KB

16 чел.

Комбинация многомерного и реляционного подхода: киоски (витрины) данных.

Реляционный подход: есть сущности и отношения, логические связи между ними, которые реализуются с помощью ключевых полей.

Преимущества реляционных ХД:

  1. неограниченный объем хранения данных
  2. т.к. РСУБД лежат в основе большинства OLTP систем, а те в свою очередь являются основным источником данных для хранилищ, то упрощена загрузка данных в ХД (OLTP (Online Transaction Processing), транзакционная система — обработка транзакций в реальном времени. Способ организации БД, при котором система работает с небольшими по размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется от системы минимальное время отклика.
  3.  Термин OLTP применяют также к системам (приложениям). OLTP-системы предназначены для ввода, структурированного хранения и обработки информации (операций, документов) в режиме реального времени)
  4. при добавлении новых изменений не нужно выполнять сложную физическую реорганизацию хранилища
  5. высокий уровень защиты данных и широкие возможности разграничения прав доступа

Недостатки: при многоуровневой иерархии множатся таблицы измерений, в результате скорость запросов снижается.

Реляционные ХД рекомендуется применять: при значительном объеме хранимых данных; при несложной иерархии измерений; если требуется частое измерение размерности данных.

Многомерные хранилища данных: много измерений

Преимущества:

  1. Более наглядно
  2. Широкий спектр возможностей построения аналитических запросов
  3. Более высокая скорость выполнения запросов

Недостатки:

  1. Требуется больший объем памяти
  2. Структура трудно поддается модификации

Многомерные хранилища данных выгодно использовать, когда объем данных невелик и есть стабильный набор измерений 

Витрина данных - это срез ХД, представляющий собой массив тематической, узконаправленной информации, ориентированной на конкретную группу пользователей. Структуры данных этих витрин максимально должны отвечать потребностям решаемых задач.

Измерения: это сущности, наименования и свойства объектов, используемые в бизнес проектах. Измерения хранятся в сущностях.

Факты: данные, количественно описывающие бизнес-процесс, непрерывные по своему характеру. Факты хранятся в таблицах отношения, вместе с агрегируемыми данными. Факты являются объектом анализа.

Гибридные хранилища данных

Многомерная и реляционная модели ХД имеют свои преимущества и недостатки. Например, многомерная модель позволяет быстрее получить ответ на запрос, но не дает возможности эффективно управлять такими же большими объемами данных, как реляционная модель.

Логично было бы использовать такую модель ХД, которая представляла бы собой комбинацию реляционной и многомерной моделей и позволяла бы сочетать высокую производительность, характерную для многомерной модели, и возможность хранить сколь угодно большие массивы данных, присущую реляционной модели. Такая модель, сочетающая в себе принципы реляционной и многомерной моделей, получила название гибридной, или HOLAP (Hybrid OLAP).

Хранилища данных, построенные на основе HOLAP, называются гибридными хранилищами данных (ГХД).


Гибридное ХД

Главным принципом построения ГХД является то, что детализированные данные хранятся в реляционной структуре (ROLAP), которая позволяет хранить большие объемы данных, а агрегированные — в многомерной (MOLAP), которая позволяет увеличить скорость выполнения запросов (поскольку при выполнении аналитических запросов уже не требуется вычислять агрегаты).

Пример 

В супермаркете, ежедневно обслуживающем десятки тысяч покупателей, установлена регистрирующая OLTP-система. При этом максимальному уровню детализации регистрируемых данных соответствует покупка по одному чеку, в котором указываются общая сумма покупки, наименования или коды приобретенных товаров и стоимость каждого товара. Оперативная информация, состоящая из детализированных данных, консолидируется в реляционной структуре ХД. С точки зрения анализа представляют интерес обобщенные данные, например, по группам товаров, отделам или некоторым интервалам дат. Поэтому исходные детализированные данные агрегируются, и вычисленные агрегаты сохраняются в многомерной структуре гибридного ХД.

Если данные, поступающие из OLTP-системы, имеют большой объем (несколько десятков тысяч записей в день и более) и высокую степень детализации, а для анализа используются в основном обобщенные данные, гибридная архитектура хранилища оказывается наиболее подходящей.

Недостатком гибридной модели является усложнение администрирования ХД из-за более сложного регламента его пополнения, поскольку при этом необходимо согласовывать изменения в реляционной и многомерной структурах.

Преимущества:

Построение OLAP-куба выполняется по запросу OLAP-средства на основе реляционных и многомерных данных. Такой подход позволяет избежать взрывного роста данных. При этом можно достичь оптимального времени исполнения клиентских запросов.


 

А также другие работы, которые могут Вас заинтересовать

20743. Векторное (линейное) пространство. Линейная зависимость и независимость системы векторов. Базис и ранг конечной системы векторов. Базис и размерность векторного пространства 63.5 KB
  Векторноелинейноепространство. Совокупность всех nмерных векторов образует nмерное пространство ОПР2:S={a1a2ak} произвольная система векторов nмерного пространства Система векторов называется линейно зависимой если не все равны 0такие чтодействительные числа1. Если 1 выполняется только в том случае когда все числа то система векторов называется линейно независимой. Свойства линейно зависимыхнезависимыхсистем: 1Система векторов S линейно зависима тогда и только тогда когда существует вектор линейно выражающийся через...
20744. Числовое поле. Поле комплексных чисел. Геометрическое представление комплексных чисел и операций над ними. Тригонометрическая форма комплексного числа 95.5 KB
  Поле комплексных чисел. Определение: Кольцо К называется полем если К коммутативное кольцо 0к ≠ 1к Для любого х є К=К {0к} существует х1 є К. хх1 = х1х = 1к любой ненулевой элемент обратим Замечание: В поле любой ненулевой элемент обратим поэтому можно определить операцию деления и частного двух элементов.
20746. Простые числа. Бесконечность множества простых чисел. Каноническое разложение составного числа и его единственность 44.5 KB
  Определение: Всякое натуральное число p 1 не имеющее других натуральных делителей кроме 1 и p называется простым числом. Наименьшее простое число 2. 1 Если p 1 является наименьшим делителем целого числа n 1 то оно простое число p. 2 Если произведение где p простое число то по крайней мере либо либо .