27147

Комбинация многомерного и реляционного подхода: киоски (витрины) данных

Доклад

Информатика, кибернетика и программирование

Преимущества реляционных ХД: неограниченный объем хранения данных т. РСУБД лежат в основе большинства OLTP систем а те в свою очередь являются основным источником данных для хранилищ то упрощена загрузка данных в ХД OLTP Online Transaction Processing транзакционная система обработка транзакций в реальном времени. OLTPсистемы предназначены для ввода структурированного хранения и обработки информации операций документов в режиме реального времени при добавлении новых изменений не нужно выполнять сложную физическую реорганизацию...

Русский

2013-08-19

39.38 KB

16 чел.

Комбинация многомерного и реляционного подхода: киоски (витрины) данных.

Реляционный подход: есть сущности и отношения, логические связи между ними, которые реализуются с помощью ключевых полей.

Преимущества реляционных ХД:

  1. неограниченный объем хранения данных
  2. т.к. РСУБД лежат в основе большинства OLTP систем, а те в свою очередь являются основным источником данных для хранилищ, то упрощена загрузка данных в ХД (OLTP (Online Transaction Processing), транзакционная система — обработка транзакций в реальном времени. Способ организации БД, при котором система работает с небольшими по размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется от системы минимальное время отклика.
  3.  Термин OLTP применяют также к системам (приложениям). OLTP-системы предназначены для ввода, структурированного хранения и обработки информации (операций, документов) в режиме реального времени)
  4. при добавлении новых изменений не нужно выполнять сложную физическую реорганизацию хранилища
  5. высокий уровень защиты данных и широкие возможности разграничения прав доступа

Недостатки: при многоуровневой иерархии множатся таблицы измерений, в результате скорость запросов снижается.

Реляционные ХД рекомендуется применять: при значительном объеме хранимых данных; при несложной иерархии измерений; если требуется частое измерение размерности данных.

Многомерные хранилища данных: много измерений

Преимущества:

  1. Более наглядно
  2. Широкий спектр возможностей построения аналитических запросов
  3. Более высокая скорость выполнения запросов

Недостатки:

  1. Требуется больший объем памяти
  2. Структура трудно поддается модификации

Многомерные хранилища данных выгодно использовать, когда объем данных невелик и есть стабильный набор измерений 

Витрина данных - это срез ХД, представляющий собой массив тематической, узконаправленной информации, ориентированной на конкретную группу пользователей. Структуры данных этих витрин максимально должны отвечать потребностям решаемых задач.

Измерения: это сущности, наименования и свойства объектов, используемые в бизнес проектах. Измерения хранятся в сущностях.

Факты: данные, количественно описывающие бизнес-процесс, непрерывные по своему характеру. Факты хранятся в таблицах отношения, вместе с агрегируемыми данными. Факты являются объектом анализа.

Гибридные хранилища данных

Многомерная и реляционная модели ХД имеют свои преимущества и недостатки. Например, многомерная модель позволяет быстрее получить ответ на запрос, но не дает возможности эффективно управлять такими же большими объемами данных, как реляционная модель.

Логично было бы использовать такую модель ХД, которая представляла бы собой комбинацию реляционной и многомерной моделей и позволяла бы сочетать высокую производительность, характерную для многомерной модели, и возможность хранить сколь угодно большие массивы данных, присущую реляционной модели. Такая модель, сочетающая в себе принципы реляционной и многомерной моделей, получила название гибридной, или HOLAP (Hybrid OLAP).

Хранилища данных, построенные на основе HOLAP, называются гибридными хранилищами данных (ГХД).


Гибридное ХД

Главным принципом построения ГХД является то, что детализированные данные хранятся в реляционной структуре (ROLAP), которая позволяет хранить большие объемы данных, а агрегированные — в многомерной (MOLAP), которая позволяет увеличить скорость выполнения запросов (поскольку при выполнении аналитических запросов уже не требуется вычислять агрегаты).

Пример 

В супермаркете, ежедневно обслуживающем десятки тысяч покупателей, установлена регистрирующая OLTP-система. При этом максимальному уровню детализации регистрируемых данных соответствует покупка по одному чеку, в котором указываются общая сумма покупки, наименования или коды приобретенных товаров и стоимость каждого товара. Оперативная информация, состоящая из детализированных данных, консолидируется в реляционной структуре ХД. С точки зрения анализа представляют интерес обобщенные данные, например, по группам товаров, отделам или некоторым интервалам дат. Поэтому исходные детализированные данные агрегируются, и вычисленные агрегаты сохраняются в многомерной структуре гибридного ХД.

Если данные, поступающие из OLTP-системы, имеют большой объем (несколько десятков тысяч записей в день и более) и высокую степень детализации, а для анализа используются в основном обобщенные данные, гибридная архитектура хранилища оказывается наиболее подходящей.

Недостатком гибридной модели является усложнение администрирования ХД из-за более сложного регламента его пополнения, поскольку при этом необходимо согласовывать изменения в реляционной и многомерной структурах.

Преимущества:

Построение OLAP-куба выполняется по запросу OLAP-средства на основе реляционных и многомерных данных. Такой подход позволяет избежать взрывного роста данных. При этом можно достичь оптимального времени исполнения клиентских запросов.


 

А также другие работы, которые могут Вас заинтересовать

50717. Определение напряжений в днищах, нагруженных внутреннем давлением 216 KB
  Цель работы: Задачи исследования: Теоретический расчет напряжений и деформаций в эллиптическом и плоском днищах нагруженных внутренним давлением; Экспериментальное определение напряжений и деформаций в днищах сравнение их с расчетными значениями; Сравнение днищ различной формы с точки зрения возникающих в них напряжений Теоретическая часть Напряжения и деформации в эллиптических днищах нагруженных внутренним давлением В инженерной практике для расчета напряжений и деформаций пользуются...
50718. Исследование распределения напряжений в эллиптическом и коническом днищах 441.5 KB
  Расчет напряжений и деформаций в днищах нагруженных внутренним давлением. Экспериментальное определение напряжений и деформаций в днищах. Анализ результатов теоретической и экспериментального исследования напряженного...
50719. ИССЛЕДОВАНИЕ ТРЕХФАЗНОЙ ЦЕПИ ПРИ СОЕДИНЕНИИ НАГРУЗКИ ЗВЕЗДОЙ 595.5 KB
  Экспериментальное определение основных соотношений между токами, напряжениями и мощностями в симметричных и несимметричных цепях. Исследование различных режимов работы трехфазной цепи. Выяснение практической роли нейтрального провода.
50720. Анализ напряженного состояния аппарата, нагруженного внутренним давлением и изгибающим моментом 253.5 KB
  Из приведенных соотношений видно что напряжения вызванные внутренним давлением р постоянны не зависят от положения сечения на оболочке. При изгибе колонны в её стенках возникают нормальные в меридиональном направлении а также касательные напряжения которыми в виду их малости можно пренебречь. Меридиональные напряжения определяются по...
50721. ИССЛЕДОВАНИЕ НЕЛИНЕЙНОЙ ЭЛЕКТРИЧЕСКОЙ ЦЕПИ ПОСТОЯННОГО ТОКА 213.5 KB
  Цель работы Совершенствование навыков снятия вольтамперных характеристик ВАХ нелинейных элементов. Некоторые нелинейные элементы на отдельных участках ВАХ имеют малое стабилитрон или отрицательное терморезистор динамическое сопротивление. Для снятия таких ВАХ необходимо предусмотреть включение в схему эксперимента последовательно с нелинейным элементом добавочного резистора Rд рис. ВАХ линейного резистора проходит через начало координат поэтому для ее построения достаточно экспериментально получить одну точку.
50722. Определение молярной массы и плотности газа 35 KB
  Вычисление молярной массы воздуха Вычисление плотности воздуха Вычисление границ неисключенных систематических погрешностей отдельных измерений: Вычисление границы относительной погрешности результата измерения молярной массы воздуха...
50723. Використання покажчиків для роботи з функціями 37 KB
  Тема: Використання покажчиків для роботи з функціями. Ціль роботи: виробити практичні навички в написанні програм з функціями й у використання покажчиків для роботи з функціями. Обладнання: ПК,ПО Borland C++
50724. Використання спадкування для створення ієрархії класів 37 KB
  Тема: використання спадкування для створення ієрархії класів. Ціль роботи: одержати навички у використанні спадкування для створення похідних класів при простому спадкуванні. Обладнання: ПК, ПО Borland C++
50725. Використання віртуальних і покажчиків для роботи з обєктами класів 38.5 KB
  Тема: Використання віртуальних і покажчиків для роботи з обєктами класів. Ціль роботи: вивчити і навчитися використовувати віртуальні функції в мові С++. Обладнання: ПК,ПО Borland C++