27147

Комбинация многомерного и реляционного подхода: киоски (витрины) данных

Доклад

Информатика, кибернетика и программирование

Преимущества реляционных ХД: неограниченный объем хранения данных т. РСУБД лежат в основе большинства OLTP систем а те в свою очередь являются основным источником данных для хранилищ то упрощена загрузка данных в ХД OLTP Online Transaction Processing транзакционная система обработка транзакций в реальном времени. OLTPсистемы предназначены для ввода структурированного хранения и обработки информации операций документов в режиме реального времени при добавлении новых изменений не нужно выполнять сложную физическую реорганизацию...

Русский

2013-08-19

39.38 KB

16 чел.

Комбинация многомерного и реляционного подхода: киоски (витрины) данных.

Реляционный подход: есть сущности и отношения, логические связи между ними, которые реализуются с помощью ключевых полей.

Преимущества реляционных ХД:

  1. неограниченный объем хранения данных
  2. т.к. РСУБД лежат в основе большинства OLTP систем, а те в свою очередь являются основным источником данных для хранилищ, то упрощена загрузка данных в ХД (OLTP (Online Transaction Processing), транзакционная система — обработка транзакций в реальном времени. Способ организации БД, при котором система работает с небольшими по размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется от системы минимальное время отклика.
  3.  Термин OLTP применяют также к системам (приложениям). OLTP-системы предназначены для ввода, структурированного хранения и обработки информации (операций, документов) в режиме реального времени)
  4. при добавлении новых изменений не нужно выполнять сложную физическую реорганизацию хранилища
  5. высокий уровень защиты данных и широкие возможности разграничения прав доступа

Недостатки: при многоуровневой иерархии множатся таблицы измерений, в результате скорость запросов снижается.

Реляционные ХД рекомендуется применять: при значительном объеме хранимых данных; при несложной иерархии измерений; если требуется частое измерение размерности данных.

Многомерные хранилища данных: много измерений

Преимущества:

  1. Более наглядно
  2. Широкий спектр возможностей построения аналитических запросов
  3. Более высокая скорость выполнения запросов

Недостатки:

  1. Требуется больший объем памяти
  2. Структура трудно поддается модификации

Многомерные хранилища данных выгодно использовать, когда объем данных невелик и есть стабильный набор измерений 

Витрина данных - это срез ХД, представляющий собой массив тематической, узконаправленной информации, ориентированной на конкретную группу пользователей. Структуры данных этих витрин максимально должны отвечать потребностям решаемых задач.

Измерения: это сущности, наименования и свойства объектов, используемые в бизнес проектах. Измерения хранятся в сущностях.

Факты: данные, количественно описывающие бизнес-процесс, непрерывные по своему характеру. Факты хранятся в таблицах отношения, вместе с агрегируемыми данными. Факты являются объектом анализа.

Гибридные хранилища данных

Многомерная и реляционная модели ХД имеют свои преимущества и недостатки. Например, многомерная модель позволяет быстрее получить ответ на запрос, но не дает возможности эффективно управлять такими же большими объемами данных, как реляционная модель.

Логично было бы использовать такую модель ХД, которая представляла бы собой комбинацию реляционной и многомерной моделей и позволяла бы сочетать высокую производительность, характерную для многомерной модели, и возможность хранить сколь угодно большие массивы данных, присущую реляционной модели. Такая модель, сочетающая в себе принципы реляционной и многомерной моделей, получила название гибридной, или HOLAP (Hybrid OLAP).

Хранилища данных, построенные на основе HOLAP, называются гибридными хранилищами данных (ГХД).


Гибридное ХД

Главным принципом построения ГХД является то, что детализированные данные хранятся в реляционной структуре (ROLAP), которая позволяет хранить большие объемы данных, а агрегированные — в многомерной (MOLAP), которая позволяет увеличить скорость выполнения запросов (поскольку при выполнении аналитических запросов уже не требуется вычислять агрегаты).

Пример 

В супермаркете, ежедневно обслуживающем десятки тысяч покупателей, установлена регистрирующая OLTP-система. При этом максимальному уровню детализации регистрируемых данных соответствует покупка по одному чеку, в котором указываются общая сумма покупки, наименования или коды приобретенных товаров и стоимость каждого товара. Оперативная информация, состоящая из детализированных данных, консолидируется в реляционной структуре ХД. С точки зрения анализа представляют интерес обобщенные данные, например, по группам товаров, отделам или некоторым интервалам дат. Поэтому исходные детализированные данные агрегируются, и вычисленные агрегаты сохраняются в многомерной структуре гибридного ХД.

Если данные, поступающие из OLTP-системы, имеют большой объем (несколько десятков тысяч записей в день и более) и высокую степень детализации, а для анализа используются в основном обобщенные данные, гибридная архитектура хранилища оказывается наиболее подходящей.

Недостатком гибридной модели является усложнение администрирования ХД из-за более сложного регламента его пополнения, поскольку при этом необходимо согласовывать изменения в реляционной и многомерной структурах.

Преимущества:

Построение OLAP-куба выполняется по запросу OLAP-средства на основе реляционных и многомерных данных. Такой подход позволяет избежать взрывного роста данных. При этом можно достичь оптимального времени исполнения клиентских запросов.


 

А также другие работы, которые могут Вас заинтересовать

18996. Идеальные газы 249.5 KB
  Лекция IX 1. Идеальные газы. Большую статистическую сумму удается рассчитать для идеальных газов. Это системы в которых можно пренебречь взаимодействием частиц. Такое пренебрежение возможно когда взаимодействие мало черное излучение асимптотическая свобода или газ...
18997. Термодинамические величины больцмановского идеального газа 222.5 KB
  Лекция Х 1. Термодинамические величины больцмановского идеального газа. Учитывая формулы IX.5.5 и IX.5.6 находим термодинамический потенциал X.1.1 С другой стороны поэтому ...
18998. Сильно вырожденный ферми - газ 249.5 KB
  Лекция ХI 1. Сильно вырожденный ферми газ. Будем рассматривать фермионы со спином равным половине электроны протоны нейтроны когда . Посмотрим как ведет себя распределение ФермиДирака IX.2.2 XI.1.1 ка...
18999. Вырожденный бозе-газ 309 KB
  Лекция XII 1. Вырожденный бозегаз. Химический потенциал бозегаза определяется из уравнения X.2.5 XII.1.1 При заданной концентрации будем понижать температуру газа. Поскольку по условию левая часть уравнения XII.1.1 не м
19000. Черное излучение 238.5 KB
  Лекция XIII 1. Черное излучение. Черным излучением называется электромагнитное излучение находящееся в равновесии с веществом. Поскольку электромагнитное излучение состоит из фотонов то черное излучение это равновесный идеальный бозегаз: фотоны практически не взаи...
19001. Химическое равновесие 281 KB
  Лекция XIV 1. Химическое равновесие. Уравнение химической реакции общего вида можно представить в форме XIV.1.1 где химические символы реагирующих веществ целые числа отвечающие данной реакции. Например в случае превращения гремучего газа в воду имеем XIV.1.2...
19002. Флуктуации. Теорема Найквиста 329.5 KB
  Лекция XV 1. Флуктуации. До сих пор основное внимание за редкими исключениями было уделено вычислению средних значений различных физических величин. Однако статистическая теория позволяет вычислить и их флуктуации отклонение от средних связанные с самопроизвольны
19003. Описание движения системы материальных точек в нерелятивистской механике. Общая схема механики Ньютона. Основные определения 273 KB
  Лекция 1. Описание движения системы материальных точек в нерелятивистской механике. Общая схема механики Ньютона. Основные определения Основная задача механики нахождение положения тел в любые моменты времени при условии что известны начальные положения и скорос
19004. Принцип наименьшего действия (принцип Гамильтона). Уравнения Лагранжа 1.15 MB
  Лекция 2. Принцип наименьшего действия принцип Гамильтона. Уравнения Лагранжа Самая общая формулировка закона движения системы с степенями свободы дается принципом наименьшего действия или принципом Гамильтона. Согласно этому принципу каждая механическая сист