27147

Комбинация многомерного и реляционного подхода: киоски (витрины) данных

Доклад

Информатика, кибернетика и программирование

Преимущества реляционных ХД: неограниченный объем хранения данных т. РСУБД лежат в основе большинства OLTP систем а те в свою очередь являются основным источником данных для хранилищ то упрощена загрузка данных в ХД OLTP Online Transaction Processing транзакционная система обработка транзакций в реальном времени. OLTPсистемы предназначены для ввода структурированного хранения и обработки информации операций документов в режиме реального времени при добавлении новых изменений не нужно выполнять сложную физическую реорганизацию...

Русский

2013-08-19

39.38 KB

16 чел.

Комбинация многомерного и реляционного подхода: киоски (витрины) данных.

Реляционный подход: есть сущности и отношения, логические связи между ними, которые реализуются с помощью ключевых полей.

Преимущества реляционных ХД:

  1. неограниченный объем хранения данных
  2. т.к. РСУБД лежат в основе большинства OLTP систем, а те в свою очередь являются основным источником данных для хранилищ, то упрощена загрузка данных в ХД (OLTP (Online Transaction Processing), транзакционная система — обработка транзакций в реальном времени. Способ организации БД, при котором система работает с небольшими по размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется от системы минимальное время отклика.
  3.  Термин OLTP применяют также к системам (приложениям). OLTP-системы предназначены для ввода, структурированного хранения и обработки информации (операций, документов) в режиме реального времени)
  4. при добавлении новых изменений не нужно выполнять сложную физическую реорганизацию хранилища
  5. высокий уровень защиты данных и широкие возможности разграничения прав доступа

Недостатки: при многоуровневой иерархии множатся таблицы измерений, в результате скорость запросов снижается.

Реляционные ХД рекомендуется применять: при значительном объеме хранимых данных; при несложной иерархии измерений; если требуется частое измерение размерности данных.

Многомерные хранилища данных: много измерений

Преимущества:

  1. Более наглядно
  2. Широкий спектр возможностей построения аналитических запросов
  3. Более высокая скорость выполнения запросов

Недостатки:

  1. Требуется больший объем памяти
  2. Структура трудно поддается модификации

Многомерные хранилища данных выгодно использовать, когда объем данных невелик и есть стабильный набор измерений 

Витрина данных - это срез ХД, представляющий собой массив тематической, узконаправленной информации, ориентированной на конкретную группу пользователей. Структуры данных этих витрин максимально должны отвечать потребностям решаемых задач.

Измерения: это сущности, наименования и свойства объектов, используемые в бизнес проектах. Измерения хранятся в сущностях.

Факты: данные, количественно описывающие бизнес-процесс, непрерывные по своему характеру. Факты хранятся в таблицах отношения, вместе с агрегируемыми данными. Факты являются объектом анализа.

Гибридные хранилища данных

Многомерная и реляционная модели ХД имеют свои преимущества и недостатки. Например, многомерная модель позволяет быстрее получить ответ на запрос, но не дает возможности эффективно управлять такими же большими объемами данных, как реляционная модель.

Логично было бы использовать такую модель ХД, которая представляла бы собой комбинацию реляционной и многомерной моделей и позволяла бы сочетать высокую производительность, характерную для многомерной модели, и возможность хранить сколь угодно большие массивы данных, присущую реляционной модели. Такая модель, сочетающая в себе принципы реляционной и многомерной моделей, получила название гибридной, или HOLAP (Hybrid OLAP).

Хранилища данных, построенные на основе HOLAP, называются гибридными хранилищами данных (ГХД).


Гибридное ХД

Главным принципом построения ГХД является то, что детализированные данные хранятся в реляционной структуре (ROLAP), которая позволяет хранить большие объемы данных, а агрегированные — в многомерной (MOLAP), которая позволяет увеличить скорость выполнения запросов (поскольку при выполнении аналитических запросов уже не требуется вычислять агрегаты).

Пример 

В супермаркете, ежедневно обслуживающем десятки тысяч покупателей, установлена регистрирующая OLTP-система. При этом максимальному уровню детализации регистрируемых данных соответствует покупка по одному чеку, в котором указываются общая сумма покупки, наименования или коды приобретенных товаров и стоимость каждого товара. Оперативная информация, состоящая из детализированных данных, консолидируется в реляционной структуре ХД. С точки зрения анализа представляют интерес обобщенные данные, например, по группам товаров, отделам или некоторым интервалам дат. Поэтому исходные детализированные данные агрегируются, и вычисленные агрегаты сохраняются в многомерной структуре гибридного ХД.

Если данные, поступающие из OLTP-системы, имеют большой объем (несколько десятков тысяч записей в день и более) и высокую степень детализации, а для анализа используются в основном обобщенные данные, гибридная архитектура хранилища оказывается наиболее подходящей.

Недостатком гибридной модели является усложнение администрирования ХД из-за более сложного регламента его пополнения, поскольку при этом необходимо согласовывать изменения в реляционной и многомерной структурах.

Преимущества:

Построение OLAP-куба выполняется по запросу OLAP-средства на основе реляционных и многомерных данных. Такой подход позволяет избежать взрывного роста данных. При этом можно достичь оптимального времени исполнения клиентских запросов.


 

А также другие работы, которые могут Вас заинтересовать

1372. Анализ предприятия Слуцкие электрические сети 227.5 KB
  Описание структуры энергетического предприятия.Порядок организации рабочих мест и контроль над их выполнением. Организация мероприятий по технике безопасности. Технико-экономические показатели работы энергопредприятия. Мероприятия по охране окружающей среды на энергопредприятии.
1373. Влияние типов вируса папилломы человека на течение ювенильного респираторного папилломатоза 92 KB
  Организация статистического исследования. Заболеваемость ЮРП у детей. Карта сбора материала для детей, страдающих ЮРП. Распределение детей, страдающих ЮРП, по полу и методу лечения. . Статистические методы использованные для анализа материала.
1374. Вирішення економічних задач за допомого електронних таблиць 84.5 KB
  Обчислення в електронних таблицях. Моделювання математичних процесів. Моделювання розгалужених процесів. Моделювання циклічних процесів. Моделювання обчислень в економічних задачах табличного вигляду.
1375. Вычислительная техника 111 KB
  Возвращаем массив битов в место вызова функции. Сложение в двоичном коде уже преобразованных чисел. Перевод двоичного числа в десятичное представление. Количество битов в двоичном представлении числа.
1376. Конструктивное планирование жилого здания 174 KB
  В основе будущих жилых комплексов лежит идея открытого пространства. Здесь важнейшую роль играет солнечный свет, он создает настроение. За счет трансформации размеров здания и планировки (изменено соотношение глубины и ширины квартиры) свет максимально проникает во все точки ее пространства.
1377. Проектирование общежития 126.5 KB
  Изыскания выполнены для стадии рабочий проект с целью выяснения геологического строения и гидрогеологических условий площадки. Наружные сети по водоснабжению и канализации зданий общежитий запроектированы на основании Техусловий на водоснабжение
1378. Дакументы i матрыялы па гiсторыi паустання 1863-1864 гг. у Беларусi 161 KB
  Ход паустання, яго асаблiвасцi i уплыу на палiтыку царызма на Беларусi. Значэнне дзейнасцi К. Калiноўскага. Рэвалюцыйныя дакументы i матэрыялы паустання 1863-1864. Задача курсавой работы заключаецца у аналiзе падзей, дакументау i матрыялау гiсторыi паустання 1863-1864 гг. у Беларусi. Задача даследвання дазваляе дасягнуць мэты курсавой работы.
1379. История Китайской цивилизации 158 KB
  Возникновение Китайской цивилизации. Объединение Китая, Империя Цинь. Китай в период правления династии Хань. Китай в период династий Суй и Тан. Первые контакты с европейцами. Обострение социальных противоречий. Манчжурское завоевание и падение династии Мин.
1380. Создание приложений с информационной базой данных 140.5 KB
  Выбор состава технических и программных средств. Обоснование управления реляционной базой данных с помощью SQL. Описание БД, содержащей сведения о файлах и справочную информацию с промежуточными результатами поиска. Описание процедуры, определяющей выбранные критерии поиска.