27148

Многомерные хранилища данных

Доклад

Информатика, кибернетика и программирование

Сущность многомерного представления данных состоит в следующем. Например для описания процесса продаж могут понадобиться сведения о наименованиях товаров или их групп о поставщике и покупателе о городе где производились продажи а также о ценах количествах проданных товаров и общих суммах. Представление данных в виде многомерных кубов более наглядно чем совокупность нормализованных таблиц реляционной модели структуру которой представляет только администратор БД.

Русский

2013-08-19

69.22 KB

8 чел.

Многомерные хранилища данных

Основное назначение многомерных хранилищ данных (МХД) — поддержка систем, ориентированных на аналитическую обработку данных, поскольку такие хранилища лучше справляются с выполнением сложных нерегламентированных запросов.

Сущность многомерного представления данных состоит в следующем. Большинство реальных бизнес-процессов описывается множеством показателей, свойств, атрибутов и т.д. Например, для описания процесса продаж могут понадобиться сведения о наименованиях товаров или их групп, о поставщике и покупателе, о городе, где производились продажи, а также о ценах, количествах проданных товаров и общих суммах. Кроме того, для отслеживания процесса во времени должен быть введен в рассмотрение такой атрибут, как дата. Если собрать всю эту информацию в таблицу, то она окажется сложной для визуального анализа и осмысления. Более того, она может оказаться избыточной (аномалии РБД). Все это способно окончательно запутать любого, кто попытается извлечь из такой таблицы полезную информацию с целью анализа текущего состояния продаж и поиска путей оптимизации процесса торговли. Указанные проблемы возникают по одной простой причине: в плоской таблице хранятся многомерные данные.

Многомерный куб можно рассматривать как систему координат, осями которой являются измерения, например Дата, Товар, Покупатель. По осям будут откладываться значения измерений — даты, наименования товаров, названия фирм-покупателей, ФИО физических лиц и т.д.

В такой системе каждому набору значений измерений (например, «дата — товар — покупатель») будет соответствовать ячейка, в которой можно разместить числовые показатели (то есть факты), связанные с данным набором. Таким образом, между объектами бизнес-процесса и их числовыми характеристиками будет установлена однозначная связь.

Преимущества многомерного подхода.

  1.  Представление данных в виде многомерных кубов более наглядно, чем совокупность нормализованных таблиц реляционной модели, структуру которой представляет только администратор БД.
  2.  Возможности построения аналитических запросов к системе более широки.
  3.  В некоторых случаях использование многомерной модели позволяет значительно уменьшить продолжительность поиска, обеспечивая выполнение аналитических запросов практически в режиме реального времени. Это связано с тем, что агрегированные данные вычисляются предварительно и хранятся в многомерных кубах вместе с детализированными, поэтому тратить время на вычисление агрегатов при выполнении запроса уже не нужно.

Недостатки.

  1.  Для ее реализации требуется больший объем памяти. (объем данных, который может поддерживаться МХД, обычно не превышает нескольких десятков гигабайт).
  2.  Многомерная структура труднее поддается модификации; при необходимости встроить еще одно измерение требуется выполнить физическую перестройку всего многомерного куба.

Таким образом, применение МХД целесообразно только в тех случаях, когда объем используемых данных сравнительно невелик, а сама многомерная модель имеет стабильный набор измерений.

Достаточно очевидно, что даже при небольших объемах данных отчет, представленный в виде двухмерной таблицы (Модели компьютеров по оси Y и Время по оси X), нагляднее и информативнее отчета с реляционной построчной формой организации.

Реляционная модель представления данных

Многомерная модель представления данных

Модель

Месяц

Объем

 

Июнь

Июль

Август

Celeron

Июнь

12

"Celeron"

12

24

5

Celeron

Июль

24

"Pentium"

2

18

-

Celeron

Август

5

"Athlon"

-

19

-

Pentium

Июнь

2

 

 

 

 

Pentium

Июль

18

 

 

 

 

Athlon

Июль

19

 

 

 

 

Но в любом магазине имеется не три модели товара, а значительно больше (например, 30), и анализ проводится не за три, а за 12 месяцев. В случае построчного (реляционного) представления будет получен отчет в 360 строк (30х12).


 

А также другие работы, которые могут Вас заинтересовать

45601. Способы выражения причинно-следственных отношений в предложении и тексте 53.5 KB
  В русском языке выражение причинноследственных отношений в зависимости от структуры и характеристики аргументов можно дифференцировать по трем важнейшим аспектам: структурному конструкции в простом и в сложном предложениях стилистическому конструкции стилистически нейтральные и стилистически маркированные семантическому конструкции подчеркивающие семантические оттенки следствия. В силу ряда причин В сложном предложении причинноследственные отношения выражаются при помощи синтаксических конструкций с союзами причем важной...
45602. Модальность как компонент предикативности. Объективная и субъективная модальность. Основные способы выражения субъективно-модальных значений 25.42 KB
  Модальность выражается в русском языке формами наклонения интонацией а также лексическими средствами модальными словами и частицами. Модальными называются слова посредством которых говорящий оценивает свое высказывание в целом или отдельные его части с точки зрения отношения их к объективной действительности. Модальные слова нередко близки к наречиям и частицам так что разграничение первых и последних иногда оказывается затруднительным. По значению выделяются две группы модальных слов: Модальные слова выражающие логическую оценку...
45604. Новость на ТВ: параметры и структура 62.5 KB
  Репортаж: 1 комментированный; 2 некомментированный; 3 событийный; 4 тематический его называют также обозренческий в других случаях проблемный. Речевыеособенности репортажа Коммуникативная ситуация лежащая в основе репортажа достаточна проста. Ключевыми понятиями для репортажа явл: информацион характернаглядное представление о происходящем через описательноповеств формы черезреч партии участников события присутствие автора на месте происходящегонепосредственность восприятия выраженное личностное начало кот нах...
45605. Особенности публицистического метода в журналистике 38.5 KB
  Эссе –- единственный жанр у которого нет жестких жанровых критериев единственное требование – мнение автора должно быть общественно значимым. Публицистический текст ПТ: факт отношение автора к событию. Задача автора – очертить то или иное социальное явление и создать целостное представление о действительности путем обобщения. В самом произведении образ которого складывался по прочтении текста также существуют образы автора и читателя.
45606. Анализ конфликтной ситуации в газетном очерке 50.5 KB
  Как и в статье в проблемном очерке авторвыясняет причины возникновения той или иной проблемы пытается определить еедальнейшее развитие выявить пути решения. Наиболее важное отличиесостоит в том что в проблемном очерке развитие проблемной ситуации никогда непредставляется так сказать в голом виде т. Проблема в очерке выступает как преграда которую пытаютсяпреодолеть вполне конкретные люди с их достоинствами и недостатками.
45608. PR в системе коммуникаций: цели, функции, содержание 45 KB
  Связи с общественностью далее PR являются относительно новой сферой деятельности на отечественном рынке поэтому основополагающие термины и определения данного вида деятельности взяты из работ зарубежных авторов Р. полагаясь на общепризнанную экономическую литературу тоже дают определение целям задачам и функциям PRдеятельности. Целью любого вида деятельности является результат который должен быть получен в процессе данной деятельности. Функции связей с общественностью проявляются во всех аспектах этого вида деятельности начиная с...
45609. ПОНЯТИЯ ПУБЛИЧНОЙ СФЕРЫ И КОММУНИКАЦИЙ 27.5 KB
  Наиболее активно в публичной сфере сегодня развиваются политические коммуникации под которыми подразумевают общение передачу информации от управляющих к управляемым и обратно а также используемые при этом средства связи формы способы каналы общения. Фе публичных коммуникаций оказывается возможным в публичной сфере. Субъектное пространство публичной сферы Д.