27147

Комбинация многомерного и реляционного подхода: киоски (витрины) данных

Доклад

Информатика, кибернетика и программирование

Преимущества реляционных ХД: неограниченный объем хранения данных т. РСУБД лежат в основе большинства OLTP систем а те в свою очередь являются основным источником данных для хранилищ то упрощена загрузка данных в ХД OLTP Online Transaction Processing транзакционная система обработка транзакций в реальном времени. OLTPсистемы предназначены для ввода структурированного хранения и обработки информации операций документов в режиме реального времени при добавлении новых изменений не нужно выполнять сложную физическую реорганизацию...

Русский

2013-08-19

39.38 KB

16 чел.

Комбинация многомерного и реляционного подхода: киоски (витрины) данных.

Реляционный подход: есть сущности и отношения, логические связи между ними, которые реализуются с помощью ключевых полей.

Преимущества реляционных ХД:

  1. неограниченный объем хранения данных
  2. т.к. РСУБД лежат в основе большинства OLTP систем, а те в свою очередь являются основным источником данных для хранилищ, то упрощена загрузка данных в ХД (OLTP (Online Transaction Processing), транзакционная система — обработка транзакций в реальном времени. Способ организации БД, при котором система работает с небольшими по размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется от системы минимальное время отклика.
  3.  Термин OLTP применяют также к системам (приложениям). OLTP-системы предназначены для ввода, структурированного хранения и обработки информации (операций, документов) в режиме реального времени)
  4. при добавлении новых изменений не нужно выполнять сложную физическую реорганизацию хранилища
  5. высокий уровень защиты данных и широкие возможности разграничения прав доступа

Недостатки: при многоуровневой иерархии множатся таблицы измерений, в результате скорость запросов снижается.

Реляционные ХД рекомендуется применять: при значительном объеме хранимых данных; при несложной иерархии измерений; если требуется частое измерение размерности данных.

Многомерные хранилища данных: много измерений

Преимущества:

  1. Более наглядно
  2. Широкий спектр возможностей построения аналитических запросов
  3. Более высокая скорость выполнения запросов

Недостатки:

  1. Требуется больший объем памяти
  2. Структура трудно поддается модификации

Многомерные хранилища данных выгодно использовать, когда объем данных невелик и есть стабильный набор измерений 

Витрина данных - это срез ХД, представляющий собой массив тематической, узконаправленной информации, ориентированной на конкретную группу пользователей. Структуры данных этих витрин максимально должны отвечать потребностям решаемых задач.

Измерения: это сущности, наименования и свойства объектов, используемые в бизнес проектах. Измерения хранятся в сущностях.

Факты: данные, количественно описывающие бизнес-процесс, непрерывные по своему характеру. Факты хранятся в таблицах отношения, вместе с агрегируемыми данными. Факты являются объектом анализа.

Гибридные хранилища данных

Многомерная и реляционная модели ХД имеют свои преимущества и недостатки. Например, многомерная модель позволяет быстрее получить ответ на запрос, но не дает возможности эффективно управлять такими же большими объемами данных, как реляционная модель.

Логично было бы использовать такую модель ХД, которая представляла бы собой комбинацию реляционной и многомерной моделей и позволяла бы сочетать высокую производительность, характерную для многомерной модели, и возможность хранить сколь угодно большие массивы данных, присущую реляционной модели. Такая модель, сочетающая в себе принципы реляционной и многомерной моделей, получила название гибридной, или HOLAP (Hybrid OLAP).

Хранилища данных, построенные на основе HOLAP, называются гибридными хранилищами данных (ГХД).


Гибридное ХД

Главным принципом построения ГХД является то, что детализированные данные хранятся в реляционной структуре (ROLAP), которая позволяет хранить большие объемы данных, а агрегированные — в многомерной (MOLAP), которая позволяет увеличить скорость выполнения запросов (поскольку при выполнении аналитических запросов уже не требуется вычислять агрегаты).

Пример 

В супермаркете, ежедневно обслуживающем десятки тысяч покупателей, установлена регистрирующая OLTP-система. При этом максимальному уровню детализации регистрируемых данных соответствует покупка по одному чеку, в котором указываются общая сумма покупки, наименования или коды приобретенных товаров и стоимость каждого товара. Оперативная информация, состоящая из детализированных данных, консолидируется в реляционной структуре ХД. С точки зрения анализа представляют интерес обобщенные данные, например, по группам товаров, отделам или некоторым интервалам дат. Поэтому исходные детализированные данные агрегируются, и вычисленные агрегаты сохраняются в многомерной структуре гибридного ХД.

Если данные, поступающие из OLTP-системы, имеют большой объем (несколько десятков тысяч записей в день и более) и высокую степень детализации, а для анализа используются в основном обобщенные данные, гибридная архитектура хранилища оказывается наиболее подходящей.

Недостатком гибридной модели является усложнение администрирования ХД из-за более сложного регламента его пополнения, поскольку при этом необходимо согласовывать изменения в реляционной и многомерной структурах.

Преимущества:

Построение OLAP-куба выполняется по запросу OLAP-средства на основе реляционных и многомерных данных. Такой подход позволяет избежать взрывного роста данных. При этом можно достичь оптимального времени исполнения клиентских запросов.


 

А также другие работы, которые могут Вас заинтересовать

71277. Понятие «способности». Структура и виды способностей 2.29 MB
  Структура и виды способностей Проблема способностей всегда волновала умы и с теоретической и с практической стороны. Встречая проявления ярких способностей мы удивляемся и восхищаемся ими. Почти каждому хочется узнать потенциал своих способностей.
71278. Обработка сталей и чугунов резанием 169 KB
  Пластичные сплавы обрабатываются труднее чем менее пластичные сплавы обладающие большей теплопроводностью и теплоемкостью легче так как температура резания при обработке этих сплавов ниже. Алюминиевые сплавы.
71279. Понятие о темпераменте. Физиологические основы темперамента 167.02 KB
  Темперамент выступает в качестве общей основы многих личностных характеристик человека и прежде всего характера. Физиологические основы характера В психологии понятие характер греч. Понятие характера весьма различается в теоретических построениях отдельных авторов.
71280. Воля. Общая характеристика волевых действий 85 KB
  Воля — это сознательное регулирование человеком своего поведения и деятельности, выраженное в умении преодолевать внутренние и внешние трудности при совершении целенаправленных действий и поступков. Главная функция воли заключается в сознательной регуляции активности в затрудненных условиях жизнедеятельности.
71281. ПСИХОЛОГИЯ ПОЗНАВАТЕЛЬНЫХ ПРОЦЕССОВ 193.42 KB
  По своей направленности на объект различают следующие формы внимания: сенсорное направлено на восприятие интеллектуальное направлено на мышление работу памяти и моторное направлено на движение. Ощущения и восприятия без включения памяти в акт познания переживались бы человеком как впервые...
71282. Общее представление о психологии как науке 50.5 KB
  Наличием души пытались объяснить все непонятные явления в жизни человека. Основным методом изучения считалось наблюдение человека за самим собой и описание фактов. Задача психологии – ставить эксперименты и наблюдать за тем что можно непосредственно увидеть а именно поведением...
71284. Професійна діяльність учителя початкових класів і педагогічна технологія 35.98 KB
  Аналіз вітчизняних і світових досліджень з технологізації початкового навчання. Розвивальне навчання. Тому пріоритетне завдання навчання в початковій школі у світлі реалізації Національної доктрини розвитку освіти України у XXI столітті нових концепцій виховання і навчання...
71285. РЕГИСТРЫ 174 KB
  В зависимости от способа записи информации кода числа различают параллельные последовательные и параллельно последовательные регистры. Их функция сводится только к приему хранению и передаче информации двоичного числа. Параллельный Nразрядный регистр состоит из N триггеров...