91643

Критерии выбора уровня агрегации

Доклад

Информатика, кибернетика и программирование

Например вы не только сможете оценить какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня но на основе анализа истории и структуры автомобильного рынка в более развитых с точки зрения автомобилизации регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах. День 365 10 = 3650 различных значений 2. Менеджер 300 различных значений 3. Модель Автомобиля 100 различных значений 4.

Русский

2015-07-21

38.52 KB

0 чел.

Критерии выбора уровня агрегации

Если спросить пользователя, какой уровень детализации ему желателен, он не задумываясь ответит - максимально возможный. Однако стоит оценить, сколько такое решение может стоить, и попытаться определить возможный экономический эффект от наличия данных на каждом новом уровне детализации.

Например, выбрав в качестве уровня агрегации Год, вы получите возможность проанализировать общие тенденции автомобильного рынка и спрогнозировать динамику его развития. Выбрав же в качестве уровня агрегации Месяц или Неделю, вы, кроме того, сможете спрогнозировать спрос на конкретные модели в конкретные моменты времени. И хотя автомобили - товар не сезонный, скорее всего, весной и летом их покупают больше, чем осенью и зимой. Это позволит отследить возможные сезонные колебания, рациональнее формировать свой склад и более эффективно проводить политику формирования сезонных скидок и распродаж. А если в систему введена информация о затратах на маркетинг, появится возможность проследить эффект от каждого конкретного маркетингового мероприятия.

Выбор в качестве уровня агрегации Номер Контракта/Счета позволит перейти на качественно новый уровень анализа. На этом уровне можно будет учитывать взаимосвязи между конкретным Автомобилем, Менеджером и Покупателем. А поскольку при покупке автомобиля заполняется множество документов, то доступна достаточно детальная информация о каждом конкретном Покупателе (Возраст, Пол, Место жительства, Вид оплаты и т.д.). Теперь вы сможете проанализировать не только рынок, но и заглянуть внутрь своей фирмы и всесторонне проанализировать эффективность работы каждого Менеджера и Подразделения. Но наиболее ценное, что вы получаете, - это информация о Регионах и Покупателях. Например, вы не только сможете оценить, какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня, но на основе анализа истории и структуры автомобильного рынка в более развитых, с точки зрения автомобилизации, регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах.

Однако переход на каждый следующий уровень детализации и добавление новых источников данных могут привести к увеличению, иногда более чем на порядок, размера целевой МБД и соответствующему удорожанию и усложнению аппаратного решения.

Рассмотрим в качестве примера Показатель Объем продаж. Анализ предметной области показывает, что он однозначно определяется комбинацией четырех Измерений:

1. {Год | Полугодие | Квартал | Месяц | Неделя | День | Счет}

2. {Страна | Регион | Филиал | Менеджер}

3. {Фирма-Производитель | Завод-Производитель | Модель Автомобиля}

4. {Тип скидки}

Выбрав уровень детализации:

1. День (365 * 10 = 3650 различных значений),

2. Менеджер (300 различных значений),

3. Модель Автомобиля (100 различных значений),

4. Тип Скидки (4 различных значения),

получим куб, состоящий из 438000000 ячеек. Но в основе используемого в МСУБД способа хранения данных лежит предположение о том, что внутри, в данном случае четырехмерного гиперкуба, нет пустот. Данные в МСУБД представлены в виде разреженных матриц с заранее фиксированной размерностью. При этом значения Показателей хранятся в виде множества логически упорядоченных блоков (массивов), имеющих фиксированную длину, причем именно блок является минимальной индексируемой единицей.

Таким образом, в нашей БД будет сразу же зарезервировано место для всех 438 млн. значений Показателя Объем Продаж. Причем цифры "300 менеджеров" и "100 моделей автомобилей" вовсе не означают того, что сегодняшняя номенклатура фирмы - 100 различных моделей, которые продают 300 человек. Цифра 300 говорит о том, что в фирме за 10 лет ее существования работало 300 различных менеджеров. Сегодня же их может быть, например, всего 30.

Попробуем оценить, какой процент ячеек в нашем случае будет содержать реальные значения. Предположим, что в среднем в фирме постоянно работает около 30 менеджеров, менеджер продает в день 10 различных моделей и при продаже каждого автомобиля может быть использован только один вариант скидки. Тогда 3650 * 30 * 10 * 1 = 1095000. То есть только 0,25% ячеек куба будет содержать реальные значения данных. И хотя в МСУБД обычно предполагается, что блоки, полностью заполненные неопределенными значениями, не хранятся, как правило, это не обеспечивает полного решения проблемы.


 

А также другие работы, которые могут Вас заинтересовать

54612. Молодежь в современном обществе 49 KB
  Работа в группах составление минидоклада используя мультимедийный диск составление вопросов по изучаемому материалу 5мин. Выступление представителя группы знакомство класса с изученным материалом 5 мин 3. Проверка знаний: тестовое задание 5мин ТЕХНОЛОГИЧЕСКАЯ КАРТА УРОКА Этапы урока Деятельность учителя Деятельность учащихся Конт роль времени Оргмомент Вступительное слово учителя 1 мин. Постановка цели корректировка Формулировка цели урока 3 мин Изучение нового...
54613. Перекрестная эластичность. Эластичность по доходу 26.62 KB
  Под эластичностью спроса по доходам понимается изменение спроса на товар в связи с изменением доходов потребителей. Если рост доходов приводит к росту спроса на товар, то данный товар относится к категории «нормальных», при снижении доходов потребителя и росте спроса на товар – товар относится к категории «низших».
54614. Социум как особенная часть мира. Системное строение общества 66 KB
  Системное строение общества. Для характеристики общества как системы используется понятие подсистема или сфера жизни общества. Черты общества как системы: 1 целостность; 2 наличие и взаимосвязь элементов; 3 качественная определенность т. Признаки общества как динамичной системы: 1 самодостаточность; 2 способность к самовоспроизводству; 3 способность к изменениям саморазвитию как отдельных элементов так и общества в целом.
54615. Стадийный подход 73 KB
  Характерным для традиционного аграрного общества является господство редистрибутивных отношений которые могут выражаться в самых разных формах: централизованное государственное хозяйство древнего Египта и средневекового Китая; русская крестьянская община где редистрибуция выражается в регулярных переделах земли по количеству едоков и т. Эта привязанность проявлялась в том что каждый член общества был включен в какойлибо коллектив и в зависимости каждого от старших по возрасту происхождению общественному положению которые и...
54616. Различные виды чтения применяемые на уроках иностранного языка 57 KB
  Зрелое умение читать предполагает как владение всеми видами чтения так и легкость перехода от одного его вида к другому в зависимости от изменения цели получения информации из данного текста. Это беглое выборочное чтение чтение текста по блокам для более подробного ознакомления с его фокусирующими деталями и частями. Полнота понимания при просмотровом чтении определяется возможностью ответить на вопрос представляет ли данный текст интерес для читающего какие части текста могут оказаться в этом отношении наиболее информативными и должны...
54618. Здоровя – мудрих гонорар 56 KB
  Мати купала своїх діток мила їхні голівоньки різними травами зіллям що позитивно впливало на здоровя і приємно пахло. Це корисно для зміцнення здоров’я та закалювання організму. Що більш шкідливо для здоров’я...
54619. Подорож океанами 1.19 MB
  Варіант оформлення місця проведення: фізична карта світу для тих етапів де потрібно морські пейзажі корабель з паперу на синьому фоні портрети мореплавців емблеми учасникам на морську тематику та інше. Етап Штурманський Проїдьте світовим океаном і визначте координати наступних географічних об’єктів кть об’єктів залежить від кількості учасників наприклад: Маріанський жолоб; о. Врангеля; Етап Історикогеографічний Ф Магеллан Ф. Етап Екологічний...
54620. Внутрішні води Північної Америки 386.5 KB
  Найбільші річки це Міссісіпі разом з найбільшою притокою Міссурі. учитель ділить клас на групи кожній групі своя річка яку необхідно охарактеризувати І група Колумбія відноситься до басейну Тихого океану ІІ група Маккензі Північного Льодовитого океану ІІІ група Міссісіпі Атлантичного океану Проблема забруднення вод Північної Америки.км2 Міссісіпі з Міссурі 6420 3268 Маккензі з р. Річка Міссісіпі Найдовша річкова артерія Північної Америки – Міссісіпі з притокою Міссурі 6420 км площа водозбору якої становить 3300...