91643

Критерии выбора уровня агрегации

Доклад

Информатика, кибернетика и программирование

Например вы не только сможете оценить какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня но на основе анализа истории и структуры автомобильного рынка в более развитых с точки зрения автомобилизации регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах. День 365 10 = 3650 различных значений 2. Менеджер 300 различных значений 3. Модель Автомобиля 100 различных значений 4.

Русский

2015-07-21

38.52 KB

0 чел.

Критерии выбора уровня агрегации

Если спросить пользователя, какой уровень детализации ему желателен, он не задумываясь ответит - максимально возможный. Однако стоит оценить, сколько такое решение может стоить, и попытаться определить возможный экономический эффект от наличия данных на каждом новом уровне детализации.

Например, выбрав в качестве уровня агрегации Год, вы получите возможность проанализировать общие тенденции автомобильного рынка и спрогнозировать динамику его развития. Выбрав же в качестве уровня агрегации Месяц или Неделю, вы, кроме того, сможете спрогнозировать спрос на конкретные модели в конкретные моменты времени. И хотя автомобили - товар не сезонный, скорее всего, весной и летом их покупают больше, чем осенью и зимой. Это позволит отследить возможные сезонные колебания, рациональнее формировать свой склад и более эффективно проводить политику формирования сезонных скидок и распродаж. А если в систему введена информация о затратах на маркетинг, появится возможность проследить эффект от каждого конкретного маркетингового мероприятия.

Выбор в качестве уровня агрегации Номер Контракта/Счета позволит перейти на качественно новый уровень анализа. На этом уровне можно будет учитывать взаимосвязи между конкретным Автомобилем, Менеджером и Покупателем. А поскольку при покупке автомобиля заполняется множество документов, то доступна достаточно детальная информация о каждом конкретном Покупателе (Возраст, Пол, Место жительства, Вид оплаты и т.д.). Теперь вы сможете проанализировать не только рынок, но и заглянуть внутрь своей фирмы и всесторонне проанализировать эффективность работы каждого Менеджера и Подразделения. Но наиболее ценное, что вы получаете, - это информация о Регионах и Покупателях. Например, вы не только сможете оценить, какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня, но на основе анализа истории и структуры автомобильного рынка в более развитых, с точки зрения автомобилизации, регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах.

Однако переход на каждый следующий уровень детализации и добавление новых источников данных могут привести к увеличению, иногда более чем на порядок, размера целевой МБД и соответствующему удорожанию и усложнению аппаратного решения.

Рассмотрим в качестве примера Показатель Объем продаж. Анализ предметной области показывает, что он однозначно определяется комбинацией четырех Измерений:

1. {Год | Полугодие | Квартал | Месяц | Неделя | День | Счет}

2. {Страна | Регион | Филиал | Менеджер}

3. {Фирма-Производитель | Завод-Производитель | Модель Автомобиля}

4. {Тип скидки}

Выбрав уровень детализации:

1. День (365 * 10 = 3650 различных значений),

2. Менеджер (300 различных значений),

3. Модель Автомобиля (100 различных значений),

4. Тип Скидки (4 различных значения),

получим куб, состоящий из 438000000 ячеек. Но в основе используемого в МСУБД способа хранения данных лежит предположение о том, что внутри, в данном случае четырехмерного гиперкуба, нет пустот. Данные в МСУБД представлены в виде разреженных матриц с заранее фиксированной размерностью. При этом значения Показателей хранятся в виде множества логически упорядоченных блоков (массивов), имеющих фиксированную длину, причем именно блок является минимальной индексируемой единицей.

Таким образом, в нашей БД будет сразу же зарезервировано место для всех 438 млн. значений Показателя Объем Продаж. Причем цифры "300 менеджеров" и "100 моделей автомобилей" вовсе не означают того, что сегодняшняя номенклатура фирмы - 100 различных моделей, которые продают 300 человек. Цифра 300 говорит о том, что в фирме за 10 лет ее существования работало 300 различных менеджеров. Сегодня же их может быть, например, всего 30.

Попробуем оценить, какой процент ячеек в нашем случае будет содержать реальные значения. Предположим, что в среднем в фирме постоянно работает около 30 менеджеров, менеджер продает в день 10 различных моделей и при продаже каждого автомобиля может быть использован только один вариант скидки. Тогда 3650 * 30 * 10 * 1 = 1095000. То есть только 0,25% ячеек куба будет содержать реальные значения данных. И хотя в МСУБД обычно предполагается, что блоки, полностью заполненные неопределенными значениями, не хранятся, как правило, это не обеспечивает полного решения проблемы.


 

А также другие работы, которые могут Вас заинтересовать

13091. Классный час «Что такое толерантность» 39 KB
  Классный час Что такое толерантность /15 классы/ Классный час проводится волонтёрами-старшеклассниками. Цель: Знакомство и работа с понятием толерантная личность. Здравствуйте дети Меня зовут. Сегодня я пришла пришёл к вам чтобы рассказать вам о дружбе
13092. Классный час «Дружба» 50 KB
  Классный час по теме Дружба 1 класс . ТЕМА: Трудно одному на свете жить. ОБОРУДОВАНИЕ И МАТЕРИАЛЫ: сердечки из бумаги с правилами дружбы доверяй прощай уважай будь внимателен будь верным береги и одно пустое 7 шт.; белые звёздочки; цветные фл
13093. Классный час «Интернет: да или нет» 91 KB
  Классный час Интернет: да или нет Цели: Формирование информационной культуры школьников представления о плюсах и минусах Интернета на основе игрового диспута. Развитие познавательного интереса творческой активности учащихся. Воспитание уважени...
13094. Классный час «А ну-ка, мальчики!» 70.5 KB
  Классный час к 23 Февраля А нука мальчики Цель: Создать атмосферу праздника в игресоревновании. Задачи: Познакомить детей с родами войск. Развитие памяти внимания организованности самостоятельности умений согласовывать интересы в процессе преодолен...
13095. Классный час «Сталинградская битва в военных фотографиях» 54.5 KB
  Классный час на тему Сталинградская битва в военных фотографиях Цели: Познакомить обучающихся с основными этапами Сталинградской битвы. Подвести обучающихся к пониманию значения героической обороны Сталинграда. Оборудование: проектор экр...
13096. Сталинградская битва. Ты хочешь мира? Помни о войне!. Сталинградская битва 24.89 KB
  Литературно-исторический вечер Ты хочешь мира Помни о войне. Сталинградская битва Цели: углубить знания учащихся о ходе Сталинградской битвы; развивать чувство гордости и сопричастности к прошлому своего народа своей страны; воспитывать патриотические ч
13097. Современный этикет. Классный час 58 KB
  Классный час на тему Современный этикет Цели усвоить основные этические требования в поведении и общении с людьми овладеть навыками культурного поведения. Сегодня мы поговори...
13098. Дружба и отношения между мальчиками и девочками. Классный час 32.5 KB
  Классный час на тему Дружба и отношения между мальчиками и девочками Цель: создавать условия для эмоционального роста детей; углубить представления о гендерном равенстве. Задачи: раскрыть значение понятий мужское дело и женское дело; развивать кул
13099. Классный час на тему «Приключение по стране рассказов Н.Н. Носова» 37.79 KB
  Классный час на тему Приключение по стране рассказов Н.Н. Носова. Тема: Приключение по стране рассказов Н.Н. Носова. Цель занятия: в игровой форме провести ознакомление и повторение произведений Н.Н. Носова. Участники: класс Продолжительность: 45 минут ...