91643

Критерии выбора уровня агрегации

Доклад

Информатика, кибернетика и программирование

Например вы не только сможете оценить какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня но на основе анализа истории и структуры автомобильного рынка в более развитых с точки зрения автомобилизации регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах. День 365 10 = 3650 различных значений 2. Менеджер 300 различных значений 3. Модель Автомобиля 100 различных значений 4.

Русский

2015-07-21

38.52 KB

0 чел.

Критерии выбора уровня агрегации

Если спросить пользователя, какой уровень детализации ему желателен, он не задумываясь ответит - максимально возможный. Однако стоит оценить, сколько такое решение может стоить, и попытаться определить возможный экономический эффект от наличия данных на каждом новом уровне детализации.

Например, выбрав в качестве уровня агрегации Год, вы получите возможность проанализировать общие тенденции автомобильного рынка и спрогнозировать динамику его развития. Выбрав же в качестве уровня агрегации Месяц или Неделю, вы, кроме того, сможете спрогнозировать спрос на конкретные модели в конкретные моменты времени. И хотя автомобили - товар не сезонный, скорее всего, весной и летом их покупают больше, чем осенью и зимой. Это позволит отследить возможные сезонные колебания, рациональнее формировать свой склад и более эффективно проводить политику формирования сезонных скидок и распродаж. А если в систему введена информация о затратах на маркетинг, появится возможность проследить эффект от каждого конкретного маркетингового мероприятия.

Выбор в качестве уровня агрегации Номер Контракта/Счета позволит перейти на качественно новый уровень анализа. На этом уровне можно будет учитывать взаимосвязи между конкретным Автомобилем, Менеджером и Покупателем. А поскольку при покупке автомобиля заполняется множество документов, то доступна достаточно детальная информация о каждом конкретном Покупателе (Возраст, Пол, Место жительства, Вид оплаты и т.д.). Теперь вы сможете проанализировать не только рынок, но и заглянуть внутрь своей фирмы и всесторонне проанализировать эффективность работы каждого Менеджера и Подразделения. Но наиболее ценное, что вы получаете, - это информация о Регионах и Покупателях. Например, вы не только сможете оценить, какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня, но на основе анализа истории и структуры автомобильного рынка в более развитых, с точки зрения автомобилизации, регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах.

Однако переход на каждый следующий уровень детализации и добавление новых источников данных могут привести к увеличению, иногда более чем на порядок, размера целевой МБД и соответствующему удорожанию и усложнению аппаратного решения.

Рассмотрим в качестве примера Показатель Объем продаж. Анализ предметной области показывает, что он однозначно определяется комбинацией четырех Измерений:

1. {Год | Полугодие | Квартал | Месяц | Неделя | День | Счет}

2. {Страна | Регион | Филиал | Менеджер}

3. {Фирма-Производитель | Завод-Производитель | Модель Автомобиля}

4. {Тип скидки}

Выбрав уровень детализации:

1. День (365 * 10 = 3650 различных значений),

2. Менеджер (300 различных значений),

3. Модель Автомобиля (100 различных значений),

4. Тип Скидки (4 различных значения),

получим куб, состоящий из 438000000 ячеек. Но в основе используемого в МСУБД способа хранения данных лежит предположение о том, что внутри, в данном случае четырехмерного гиперкуба, нет пустот. Данные в МСУБД представлены в виде разреженных матриц с заранее фиксированной размерностью. При этом значения Показателей хранятся в виде множества логически упорядоченных блоков (массивов), имеющих фиксированную длину, причем именно блок является минимальной индексируемой единицей.

Таким образом, в нашей БД будет сразу же зарезервировано место для всех 438 млн. значений Показателя Объем Продаж. Причем цифры "300 менеджеров" и "100 моделей автомобилей" вовсе не означают того, что сегодняшняя номенклатура фирмы - 100 различных моделей, которые продают 300 человек. Цифра 300 говорит о том, что в фирме за 10 лет ее существования работало 300 различных менеджеров. Сегодня же их может быть, например, всего 30.

Попробуем оценить, какой процент ячеек в нашем случае будет содержать реальные значения. Предположим, что в среднем в фирме постоянно работает около 30 менеджеров, менеджер продает в день 10 различных моделей и при продаже каждого автомобиля может быть использован только один вариант скидки. Тогда 3650 * 30 * 10 * 1 = 1095000. То есть только 0,25% ячеек куба будет содержать реальные значения данных. И хотя в МСУБД обычно предполагается, что блоки, полностью заполненные неопределенными значениями, не хранятся, как правило, это не обеспечивает полного решения проблемы.


 

А также другие работы, которые могут Вас заинтересовать

38354. Концепція регіоналістики Уолтера Ізарда 22.01 KB
  РЕГІОНАЛІСТИКА (англ. region лат. regio — область, район) — наука, яка займається вивченням просторових закономірностей територіальної організації виробничих сил.
38355. Митне право. Курс лекцій 565 KB
  Але ці методичні рекомендації мають широке розгалуження за відповідними різними формами роботи студентів а отже в цілому вони будуть слугувати усім студентам хто виявить велике бажання більше дізнатись про правові аспекти діяльності митних органів України. План семінарських занять тематика рефератів та контрольних робіт перелік навчальної та додаткової літератури це ті основні види робіт що спрямовані на досягнення єдиної мети засвоєння та використання на практиці теоретичних начал економічних важелів розвитку України і зокрема...
38357. Теорія міжнародного права 931.5 KB
  Міжнародне право - це самостійна система права, що складається з юридично обовязкових принципів і норм, які регулюють відносини між державами та іншими субєктами міжнародного права з метою забезпечення мирного співіснування та міжнародної співпраці.
38358. Правовые системы современных мусульманских государств 42.83 KB
  Теоретические основы мусульманского права. Особенности мусульманского права. Источники мусульманского права. Структура мусульманского права.
38359. Мусульманское право 41 KB
  История мусульманского права нередко обозначаемого термином фикх начинается с пророка Мухаммеда Мухаммада жившего в 570 по некоторым источникам 571 г. Позднее и те и другие нормы нашли отражение в первичных источниках мусульманской религии и права. существенное влияние на развитие мусульманского права оказали исламские правоведы и мусульманские судьи кади. Мусульманские судьи лишились права при отсутствии в Коране сунне и других источниках нужных норм выносить решения по своему усмотрению.
38360. Національна економіка. Особливості економічної теорії 1.32 MB
  Загалом названі цілі досягаються через застосування певних інструментів макроекономічного регулювання економіки основними з яких є: фіскальна політика оперування державним бюджетом через податкову систему і витрати держави; грошовокредитна політика контроль за грошовою пропозицією через ставку відсотка резервну норму та інше; політика регулювання доходів від вільного встановлення заробітної плати і цін до декретного контролю; зовнішньоекономічна політика торгівельна політика регулювання обмінного курсу. Етапи становлення системи...
38361. Праця як основа розвитку суспільства і чинник виробництва 399.5 KB
  Кожен субєкт ринкового господарства одночасно є і субєктом трудових відносин тому від знання економічних законів функціонування ринку праці зайнятості організації оплати праці великою мірою залежить ефективність використання ресурсів праці а також успіх підприємця й рівень життя населення країни. Це обумовлює обєктивну необхідність набуття ґрунтовних знань основних положень економіки праці майбутніми фахівцями всіх економічних спеціальностей. Вивчення та аналіз закономірностей організації й результатів функціонування ринків праці...
38362. Соціально - трудові відносини на ринку праці 2.08 MB
  Навчально методичний комплекс з дисципліни Економіка праці та соціально трудові відносини. Соціально трудові відносини на ринку праціâ для самостійної роботи студентів 3 курсу всіх форм навчання всіх спеціальностей Укл. 95 ПЕРЕДМОВА У даному навчальнометодичному комплексі розглянуто другий розділ дисципліни âЕкономіка праці та соціальнотрудові відносиниâ [Розділ 1 дивись джерело 25] присвячений питанням...