27148

Многомерные хранилища данных

Доклад

Информатика, кибернетика и программирование

Сущность многомерного представления данных состоит в следующем. Например для описания процесса продаж могут понадобиться сведения о наименованиях товаров или их групп о поставщике и покупателе о городе где производились продажи а также о ценах количествах проданных товаров и общих суммах. Представление данных в виде многомерных кубов более наглядно чем совокупность нормализованных таблиц реляционной модели структуру которой представляет только администратор БД.

Русский

2013-08-19

69.22 KB

8 чел.

Многомерные хранилища данных

Основное назначение многомерных хранилищ данных (МХД) — поддержка систем, ориентированных на аналитическую обработку данных, поскольку такие хранилища лучше справляются с выполнением сложных нерегламентированных запросов.

Сущность многомерного представления данных состоит в следующем. Большинство реальных бизнес-процессов описывается множеством показателей, свойств, атрибутов и т.д. Например, для описания процесса продаж могут понадобиться сведения о наименованиях товаров или их групп, о поставщике и покупателе, о городе, где производились продажи, а также о ценах, количествах проданных товаров и общих суммах. Кроме того, для отслеживания процесса во времени должен быть введен в рассмотрение такой атрибут, как дата. Если собрать всю эту информацию в таблицу, то она окажется сложной для визуального анализа и осмысления. Более того, она может оказаться избыточной (аномалии РБД). Все это способно окончательно запутать любого, кто попытается извлечь из такой таблицы полезную информацию с целью анализа текущего состояния продаж и поиска путей оптимизации процесса торговли. Указанные проблемы возникают по одной простой причине: в плоской таблице хранятся многомерные данные.

Многомерный куб можно рассматривать как систему координат, осями которой являются измерения, например Дата, Товар, Покупатель. По осям будут откладываться значения измерений — даты, наименования товаров, названия фирм-покупателей, ФИО физических лиц и т.д.

В такой системе каждому набору значений измерений (например, «дата — товар — покупатель») будет соответствовать ячейка, в которой можно разместить числовые показатели (то есть факты), связанные с данным набором. Таким образом, между объектами бизнес-процесса и их числовыми характеристиками будет установлена однозначная связь.

Преимущества многомерного подхода.

  1.  Представление данных в виде многомерных кубов более наглядно, чем совокупность нормализованных таблиц реляционной модели, структуру которой представляет только администратор БД.
  2.  Возможности построения аналитических запросов к системе более широки.
  3.  В некоторых случаях использование многомерной модели позволяет значительно уменьшить продолжительность поиска, обеспечивая выполнение аналитических запросов практически в режиме реального времени. Это связано с тем, что агрегированные данные вычисляются предварительно и хранятся в многомерных кубах вместе с детализированными, поэтому тратить время на вычисление агрегатов при выполнении запроса уже не нужно.

Недостатки.

  1.  Для ее реализации требуется больший объем памяти. (объем данных, который может поддерживаться МХД, обычно не превышает нескольких десятков гигабайт).
  2.  Многомерная структура труднее поддается модификации; при необходимости встроить еще одно измерение требуется выполнить физическую перестройку всего многомерного куба.

Таким образом, применение МХД целесообразно только в тех случаях, когда объем используемых данных сравнительно невелик, а сама многомерная модель имеет стабильный набор измерений.

Достаточно очевидно, что даже при небольших объемах данных отчет, представленный в виде двухмерной таблицы (Модели компьютеров по оси Y и Время по оси X), нагляднее и информативнее отчета с реляционной построчной формой организации.

Реляционная модель представления данных

Многомерная модель представления данных

Модель

Месяц

Объем

 

Июнь

Июль

Август

Celeron

Июнь

12

"Celeron"

12

24

5

Celeron

Июль

24

"Pentium"

2

18

-

Celeron

Август

5

"Athlon"

-

19

-

Pentium

Июнь

2

 

 

 

 

Pentium

Июль

18

 

 

 

 

Athlon

Июль

19

 

 

 

 

Но в любом магазине имеется не три модели товара, а значительно больше (например, 30), и анализ проводится не за три, а за 12 месяцев. В случае построчного (реляционного) представления будет получен отчет в 360 строк (30х12).


 

А также другие работы, которые могут Вас заинтересовать

1076. Финансовое планирование и контроль на предприятии 462.5 KB
  Финансовое планирование в системе финансового менеджмента. Методика текущего финансового планирования на предприятии. Финансовый контроль в системе финансового менеджмента.
1077. Расчет внутреннего водопровода здания 254.5 KB
  Построение аксонометрической схемы водопроводной сети здания. Гидравлический расчет водопроводной сети. Подбор водомерного устройства и определение потерь напора. Построение продольного профиля дворовой канализационной сети. Построение аксонометрической схемы канализационного стояка.
1078. Общая характеристика турбоустановок ТЭС и АЭС 1005 KB
  Классификация электрических станций. Обозначения паровых турбин. Основные этапы развития теплоэнергетики и турбостроения. Общее знакомство с паровой турбиной ТЭС. Компоновка тепловой электрической станции.
1079. Тепловой цикл паротурбинной установки и показатели экономичности ТЭС. Особенности турбоустановок АЭС 394.5 KB
  Тепловой цикл паротурбинной установки ТЭС и показатель его термодинамической эффективности. Энергетические показатели тепловой электростанции и общий баланс теплоты и мощности для ее энергоблоков. Абсолютные и относительные показатели экономичности турбин и турбоустановок. Расходы пара, теплоты и топлива для паротурбинной установки.
1080. Роль промежуточного перегрева водяного пара в турбоустановках ТЭС. Регенеративный подогрев питательной воды. Комбинированная выработка теплоты и электроэнергии на ТЭЦ 336.5 KB
  Промежуточный перегрев водяного пара в паротурбинных установках. Тепловая схема ПТУ с промежуточным перегревом водяного пара. Регенеративный подогрев питательной воды в турбоустановках. Комбинированная выработка теплоты и электрической энергии на ТЭЦ.
1081. Процесс расширения пара в турбинной ступени 370 KB
  Основные уравнения и формулы, используемые для расчета движения водяного пара в проточной части турбинных ступеней. Конструкция турбинной ступени осевого типа и процессы преобразования энергии в ней. Тепловая диаграмма процесса расширения в турбинной ступени. Степень реактивности турбинной ступени.
1082. Мощность и экономичность турбинных ступеней 443.5 KB
  Усилия в турбинной ступени и ее мощность. Относительный лопаточный КПД ступени. Двухвенечные ступени паровых турбин. Процесс расширения в проточной части двухвенечной ступени.
1083. Турбинные решетки и их выбор 3.25 MB
  Геометрические характеристики турбинных решеток. Газодинамические и режимные характеристики турбинных решеток. Маркировка турбинных решеток и их формирование. Зависимости для определения коэффициентов потерь сопловой решетки.
1084. Относительный внутренний КПД турбинной ступени 765.5 KB
  Потери трения диска и лопаточного бандажа. Потери при парциальном подводе водяного пара в турбинную ступень. Потери от утечек в турбинной ступени. Лабиринтовые уплотнения. Потери от влажности водяного пара.