27148

Многомерные хранилища данных

Доклад

Информатика, кибернетика и программирование

Сущность многомерного представления данных состоит в следующем. Например для описания процесса продаж могут понадобиться сведения о наименованиях товаров или их групп о поставщике и покупателе о городе где производились продажи а также о ценах количествах проданных товаров и общих суммах. Представление данных в виде многомерных кубов более наглядно чем совокупность нормализованных таблиц реляционной модели структуру которой представляет только администратор БД.

Русский

2013-08-19

69.22 KB

8 чел.

Многомерные хранилища данных

Основное назначение многомерных хранилищ данных (МХД) — поддержка систем, ориентированных на аналитическую обработку данных, поскольку такие хранилища лучше справляются с выполнением сложных нерегламентированных запросов.

Сущность многомерного представления данных состоит в следующем. Большинство реальных бизнес-процессов описывается множеством показателей, свойств, атрибутов и т.д. Например, для описания процесса продаж могут понадобиться сведения о наименованиях товаров или их групп, о поставщике и покупателе, о городе, где производились продажи, а также о ценах, количествах проданных товаров и общих суммах. Кроме того, для отслеживания процесса во времени должен быть введен в рассмотрение такой атрибут, как дата. Если собрать всю эту информацию в таблицу, то она окажется сложной для визуального анализа и осмысления. Более того, она может оказаться избыточной (аномалии РБД). Все это способно окончательно запутать любого, кто попытается извлечь из такой таблицы полезную информацию с целью анализа текущего состояния продаж и поиска путей оптимизации процесса торговли. Указанные проблемы возникают по одной простой причине: в плоской таблице хранятся многомерные данные.

Многомерный куб можно рассматривать как систему координат, осями которой являются измерения, например Дата, Товар, Покупатель. По осям будут откладываться значения измерений — даты, наименования товаров, названия фирм-покупателей, ФИО физических лиц и т.д.

В такой системе каждому набору значений измерений (например, «дата — товар — покупатель») будет соответствовать ячейка, в которой можно разместить числовые показатели (то есть факты), связанные с данным набором. Таким образом, между объектами бизнес-процесса и их числовыми характеристиками будет установлена однозначная связь.

Преимущества многомерного подхода.

  1.  Представление данных в виде многомерных кубов более наглядно, чем совокупность нормализованных таблиц реляционной модели, структуру которой представляет только администратор БД.
  2.  Возможности построения аналитических запросов к системе более широки.
  3.  В некоторых случаях использование многомерной модели позволяет значительно уменьшить продолжительность поиска, обеспечивая выполнение аналитических запросов практически в режиме реального времени. Это связано с тем, что агрегированные данные вычисляются предварительно и хранятся в многомерных кубах вместе с детализированными, поэтому тратить время на вычисление агрегатов при выполнении запроса уже не нужно.

Недостатки.

  1.  Для ее реализации требуется больший объем памяти. (объем данных, который может поддерживаться МХД, обычно не превышает нескольких десятков гигабайт).
  2.  Многомерная структура труднее поддается модификации; при необходимости встроить еще одно измерение требуется выполнить физическую перестройку всего многомерного куба.

Таким образом, применение МХД целесообразно только в тех случаях, когда объем используемых данных сравнительно невелик, а сама многомерная модель имеет стабильный набор измерений.

Достаточно очевидно, что даже при небольших объемах данных отчет, представленный в виде двухмерной таблицы (Модели компьютеров по оси Y и Время по оси X), нагляднее и информативнее отчета с реляционной построчной формой организации.

Реляционная модель представления данных

Многомерная модель представления данных

Модель

Месяц

Объем

 

Июнь

Июль

Август

Celeron

Июнь

12

"Celeron"

12

24

5

Celeron

Июль

24

"Pentium"

2

18

-

Celeron

Август

5

"Athlon"

-

19

-

Pentium

Июнь

2

 

 

 

 

Pentium

Июль

18

 

 

 

 

Athlon

Июль

19

 

 

 

 

Но в любом магазине имеется не три модели товара, а значительно больше (например, 30), и анализ проводится не за три, а за 12 месяцев. В случае построчного (реляционного) представления будет получен отчет в 360 строк (30х12).


 

А также другие работы, которые могут Вас заинтересовать

42930. Расчет двухкаскадного резистивного усилителя на биполярных транзисторах 1.87 MB
  Расчет двухкаскадного резистивного усилителя на биполярных транзисторах пояснительная записка к курсовой работе по электронике Студент гр.130601 Аннотация Данная пояснительная записка написана к курсовой работе по дисциплине Электроника для варианта 03 и содержит в себе результаты расчета резистивного усилителя на биполярных транзисторах. В качестве анализируемого усилителя выступает двухкаскадный усилитель на кремниевых биполярных транзисторах основные параметры которого рассчитываются в одной из...
42931. Анализ организационно-правовых форм предприятий и их особенностей 69.31 KB
  Центральным звеном рыночной экономики в котором принимаются и осуществляются решения об использовании ограниченного количества благ с учётом обстоятельств внешней среды которые не могут быть изменены по воле принимающих решения лиц выбора вариантов решения проблем альтернатив развития или независимых друг от друга вариантов действия направленных на достижение желаемых конечных результатов системы целей являются хозяйствующие субъекты организации предприятия домашние хозяйства...
42933. Проектирование технологического процесса изготовления Шкафа для белья 172.73 KB
  На многопильных форматно-раскроечных станках моделей ЦТМФ осуществляется раскрой плит по картам со сквозными продольными и поперечными пропилами. Для использования однопильного станка достаточно, чтобы на карте раскроя полноформатной плиты или любого раскраиваемого отрезка плиты был хотя бы один сквозной пропил при условии, что осуществление данного пропила возможно по технической характеристике данной модели станка.
42934. Расчет оборудования для вакуум-кристаллизации галургического хлорида калия на БКПРУ-1 1 MB
  Количество испаренной воды в каждой ступени рассчитываем по уравнению теплового баланса где Gnколичество щелока поступающего в nую ступень ВКУ кг ч; Сщел теплоемкость щелока кДж кгС; tн tк перепад температур в nой ступени ВКУ С; rn удельная теплота парообразования на nой ступени ВКУ кДж кг. Сводная таблица материального баланса Состав Приход кг ч Расход кг ч KCl раствор 8455216 3578556 KCl твердый 487666 NCl раствор 7241179 7241179 NCl твердый HO раствор 27354605 24168545 HO испаренная ...
42935. СЕСТРИНСКИЙ ПРОЦЕСС ПРИ АЛЛЕРГОЗАХ 403.51 KB
  Цель исследования: изучение сестринского процесса при аллергозах проведение сестринского обследования выявление настоящих и потенциальных социальных и психоэмоциональных проблем пациента и его семьи определение цели планирование и реализация сестринского процесса. В соответствии с намеченной целью и задачами необходимо использовать следующие методы исследования: научнотеоретический анализ медицинской литературы по данной теме; эмпирический наблюдение дополнительные методы исследования: организационный...
42936. Октановое число, его определение, пути повышения 138.67 KB
  Для лучшего из известных в то время бензинов изооктана 224триметилпентана который детонирует только при высоких степенях сжатия было принято октановое число 100 а для нгептана особенно склонного к детонации октановое число 0. Циклопарафины менее склонны к детонации чем нормальные парафины а ароматические углеводороды отличаются особенно высоким октановым числом. Интенсивность детонации испытуемоготоплива достигается изменением степени сжатия. Октановое число равное 100и ниже обозначает объемную долю изооктана в смеси с...
42937. Религия и повседневность: построение концептуальной схемы исследования 76.83 KB
  Религия в каждой стране и в разные эпохи, жизни человечества, развивалась и влияла по-разному на жизнь людей, где то ей подчинялись все, где-то ее изгоняли из рамок общества, теперь же еще религия может не оказывать никакого влияния на жизнь отдельно взятого индивида. Все эти события расценивались учеными по своему, поскольку каждый предлагал свое виденье происходящего, каждый старался изучить и объяснить данное явление.
42938. Проектирование цифрового фильтра 1.85 MB
  Влияние эффектов квантования на характеристики реального фильтра. Аппаратная реализация полосового фильтра. ЭКГанализ выполняется в четыре этапа: ввод ЭКГ; фильтрация ЭКГ устранение шумов; распознавание характерных элементов ЭКГ и измерение соответствующих параметров; интерпретация и классификация ЭКГ.