91643

Критерии выбора уровня агрегации

Доклад

Информатика, кибернетика и программирование

Например вы не только сможете оценить какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня но на основе анализа истории и структуры автомобильного рынка в более развитых с точки зрения автомобилизации регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах. День 365 10 = 3650 различных значений 2. Менеджер 300 различных значений 3. Модель Автомобиля 100 различных значений 4.

Русский

2015-07-21

38.52 KB

0 чел.

Критерии выбора уровня агрегации

Если спросить пользователя, какой уровень детализации ему желателен, он не задумываясь ответит - максимально возможный. Однако стоит оценить, сколько такое решение может стоить, и попытаться определить возможный экономический эффект от наличия данных на каждом новом уровне детализации.

Например, выбрав в качестве уровня агрегации Год, вы получите возможность проанализировать общие тенденции автомобильного рынка и спрогнозировать динамику его развития. Выбрав же в качестве уровня агрегации Месяц или Неделю, вы, кроме того, сможете спрогнозировать спрос на конкретные модели в конкретные моменты времени. И хотя автомобили - товар не сезонный, скорее всего, весной и летом их покупают больше, чем осенью и зимой. Это позволит отследить возможные сезонные колебания, рациональнее формировать свой склад и более эффективно проводить политику формирования сезонных скидок и распродаж. А если в систему введена информация о затратах на маркетинг, появится возможность проследить эффект от каждого конкретного маркетингового мероприятия.

Выбор в качестве уровня агрегации Номер Контракта/Счета позволит перейти на качественно новый уровень анализа. На этом уровне можно будет учитывать взаимосвязи между конкретным Автомобилем, Менеджером и Покупателем. А поскольку при покупке автомобиля заполняется множество документов, то доступна достаточно детальная информация о каждом конкретном Покупателе (Возраст, Пол, Место жительства, Вид оплаты и т.д.). Теперь вы сможете проанализировать не только рынок, но и заглянуть внутрь своей фирмы и всесторонне проанализировать эффективность работы каждого Менеджера и Подразделения. Но наиболее ценное, что вы получаете, - это информация о Регионах и Покупателях. Например, вы не только сможете оценить, какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня, но на основе анализа истории и структуры автомобильного рынка в более развитых, с точки зрения автомобилизации, регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах.

Однако переход на каждый следующий уровень детализации и добавление новых источников данных могут привести к увеличению, иногда более чем на порядок, размера целевой МБД и соответствующему удорожанию и усложнению аппаратного решения.

Рассмотрим в качестве примера Показатель Объем продаж. Анализ предметной области показывает, что он однозначно определяется комбинацией четырех Измерений:

1. {Год | Полугодие | Квартал | Месяц | Неделя | День | Счет}

2. {Страна | Регион | Филиал | Менеджер}

3. {Фирма-Производитель | Завод-Производитель | Модель Автомобиля}

4. {Тип скидки}

Выбрав уровень детализации:

1. День (365 * 10 = 3650 различных значений),

2. Менеджер (300 различных значений),

3. Модель Автомобиля (100 различных значений),

4. Тип Скидки (4 различных значения),

получим куб, состоящий из 438000000 ячеек. Но в основе используемого в МСУБД способа хранения данных лежит предположение о том, что внутри, в данном случае четырехмерного гиперкуба, нет пустот. Данные в МСУБД представлены в виде разреженных матриц с заранее фиксированной размерностью. При этом значения Показателей хранятся в виде множества логически упорядоченных блоков (массивов), имеющих фиксированную длину, причем именно блок является минимальной индексируемой единицей.

Таким образом, в нашей БД будет сразу же зарезервировано место для всех 438 млн. значений Показателя Объем Продаж. Причем цифры "300 менеджеров" и "100 моделей автомобилей" вовсе не означают того, что сегодняшняя номенклатура фирмы - 100 различных моделей, которые продают 300 человек. Цифра 300 говорит о том, что в фирме за 10 лет ее существования работало 300 различных менеджеров. Сегодня же их может быть, например, всего 30.

Попробуем оценить, какой процент ячеек в нашем случае будет содержать реальные значения. Предположим, что в среднем в фирме постоянно работает около 30 менеджеров, менеджер продает в день 10 различных моделей и при продаже каждого автомобиля может быть использован только один вариант скидки. Тогда 3650 * 30 * 10 * 1 = 1095000. То есть только 0,25% ячеек куба будет содержать реальные значения данных. И хотя в МСУБД обычно предполагается, что блоки, полностью заполненные неопределенными значениями, не хранятся, как правило, это не обеспечивает полного решения проблемы.


 

А также другие работы, которые могут Вас заинтересовать

76062. Бизнес-план фирмы «ДомМаркет» 70.92 KB
  Предприятия малого бизнеса являются гибкой и динамичной формой реализации предпринимательской деятельности позволяющей свободно выразить деловой и творческий потенциал иметь определенные заработки для достойного образа жизни.
76065. Проектирование структурированной кабельной системы ООО «Прокуратов» 1.21 MB
  Вышеперечисленные стандарты описывают почти одинаковые кабельные системы; но несколько различаются в терминологии и определениях норм для родственных параметров. Кроме терминологии, в этих стандартах имеются различия в списке применимых кабелей: в 1568-А определен коаксиальный кабель 50 Ом...
76066. Внедрение многофункциональной системы «R-keeper» в Группу компаний «ПИР» в частности в ресторан «Корчма. Веселая Кума» 2.84 MB
  Задачи проекта: Автоматизация ресторанов позволяет повысить контроль над всеми процессами протекающим в ресторане, начиная от закупок, заканчивая очерёдностью подачи блюд. Система r keep позволяет ускорить подачу блюд, автоматизировав этапы прохождения заказа от клиента до кухни.
76069. Оценка уровня механизации сельского хозяйства 587 KB
  Определение среднего возраста машин - первоочередная задача. Данная процедура позволяет определить техническое состояние МТП, объёмы капиталовложения и спрогнозировать объем текущих и капитальных ремонтов.
76070. Оценка оплаты отгруженного товара 1.34 MB
  В предметной области комплекса задач, к которой относится задача оценки оплаты отгруженного товара, рассматриваются процессы планирования и учета выпуска изделий на предприятии, сдача готовых изделий на склады и отгрузка готовой продукции заказчикам в соответствии с договорами...