91643

Критерии выбора уровня агрегации

Доклад

Информатика, кибернетика и программирование

Например вы не только сможете оценить какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня но на основе анализа истории и структуры автомобильного рынка в более развитых с точки зрения автомобилизации регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах. День 365 10 = 3650 различных значений 2. Менеджер 300 различных значений 3. Модель Автомобиля 100 различных значений 4.

Русский

2015-07-21

38.52 KB

0 чел.

Критерии выбора уровня агрегации

Если спросить пользователя, какой уровень детализации ему желателен, он не задумываясь ответит - максимально возможный. Однако стоит оценить, сколько такое решение может стоить, и попытаться определить возможный экономический эффект от наличия данных на каждом новом уровне детализации.

Например, выбрав в качестве уровня агрегации Год, вы получите возможность проанализировать общие тенденции автомобильного рынка и спрогнозировать динамику его развития. Выбрав же в качестве уровня агрегации Месяц или Неделю, вы, кроме того, сможете спрогнозировать спрос на конкретные модели в конкретные моменты времени. И хотя автомобили - товар не сезонный, скорее всего, весной и летом их покупают больше, чем осенью и зимой. Это позволит отследить возможные сезонные колебания, рациональнее формировать свой склад и более эффективно проводить политику формирования сезонных скидок и распродаж. А если в систему введена информация о затратах на маркетинг, появится возможность проследить эффект от каждого конкретного маркетингового мероприятия.

Выбор в качестве уровня агрегации Номер Контракта/Счета позволит перейти на качественно новый уровень анализа. На этом уровне можно будет учитывать взаимосвязи между конкретным Автомобилем, Менеджером и Покупателем. А поскольку при покупке автомобиля заполняется множество документов, то доступна достаточно детальная информация о каждом конкретном Покупателе (Возраст, Пол, Место жительства, Вид оплаты и т.д.). Теперь вы сможете проанализировать не только рынок, но и заглянуть внутрь своей фирмы и всесторонне проанализировать эффективность работы каждого Менеджера и Подразделения. Но наиболее ценное, что вы получаете, - это информация о Регионах и Покупателях. Например, вы не только сможете оценить, какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня, но на основе анализа истории и структуры автомобильного рынка в более развитых, с точки зрения автомобилизации, регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах.

Однако переход на каждый следующий уровень детализации и добавление новых источников данных могут привести к увеличению, иногда более чем на порядок, размера целевой МБД и соответствующему удорожанию и усложнению аппаратного решения.

Рассмотрим в качестве примера Показатель Объем продаж. Анализ предметной области показывает, что он однозначно определяется комбинацией четырех Измерений:

1. {Год | Полугодие | Квартал | Месяц | Неделя | День | Счет}

2. {Страна | Регион | Филиал | Менеджер}

3. {Фирма-Производитель | Завод-Производитель | Модель Автомобиля}

4. {Тип скидки}

Выбрав уровень детализации:

1. День (365 * 10 = 3650 различных значений),

2. Менеджер (300 различных значений),

3. Модель Автомобиля (100 различных значений),

4. Тип Скидки (4 различных значения),

получим куб, состоящий из 438000000 ячеек. Но в основе используемого в МСУБД способа хранения данных лежит предположение о том, что внутри, в данном случае четырехмерного гиперкуба, нет пустот. Данные в МСУБД представлены в виде разреженных матриц с заранее фиксированной размерностью. При этом значения Показателей хранятся в виде множества логически упорядоченных блоков (массивов), имеющих фиксированную длину, причем именно блок является минимальной индексируемой единицей.

Таким образом, в нашей БД будет сразу же зарезервировано место для всех 438 млн. значений Показателя Объем Продаж. Причем цифры "300 менеджеров" и "100 моделей автомобилей" вовсе не означают того, что сегодняшняя номенклатура фирмы - 100 различных моделей, которые продают 300 человек. Цифра 300 говорит о том, что в фирме за 10 лет ее существования работало 300 различных менеджеров. Сегодня же их может быть, например, всего 30.

Попробуем оценить, какой процент ячеек в нашем случае будет содержать реальные значения. Предположим, что в среднем в фирме постоянно работает около 30 менеджеров, менеджер продает в день 10 различных моделей и при продаже каждого автомобиля может быть использован только один вариант скидки. Тогда 3650 * 30 * 10 * 1 = 1095000. То есть только 0,25% ячеек куба будет содержать реальные значения данных. И хотя в МСУБД обычно предполагается, что блоки, полностью заполненные неопределенными значениями, не хранятся, как правило, это не обеспечивает полного решения проблемы.


 

А также другие работы, которые могут Вас заинтересовать

53211. Ділова гра «Міжнародна конференція «Здоровими бути класно!» з проблем шкідливих звичок» 109.5 KB
  Виступ дітей із дорожніми знаками у руках які вони демонструють під час виступу. Дбати про здоров’я знак інвалід потрібно з самого народження з першого крику дитини знак U. Друже не поспішай знак 1.33 зануритися у круговерть знак 4.
53212. ІНТЕЛЕКТУАЛЬНА ГРА “НАЙРОЗУМНІШИЙ” 244 KB
  На роздуми вам дається 15 секунд за які ви повинні вибрати правильну відповідь. Правильна відповідь: в пташка Спеціальність лікаря Айболита: а хірург; б ветеринар; в санітар; г окуліст. Правильна відповідь: б ветеринар 3. Правильна відповідь: в33 4.
53213. ГРА-МАНДРІВКА «СВІТ ПРОФЕССІЙ» 985 KB
  На дошці записані слова Вольтера: Жити значить працювати Праця є життя людини. Життя ― це праця і бережливість. Хліб ― праця багатьох людей. І їхня праця потрібна завжди і скрізь.
53214. Ділова гра для педагогічних працівників «Вплив сюжетно-рольової гри на формування партнерських взаємин дошкільників» 60 KB
  Час відведений для гри заповнюється читанням книг підготовкою до свят організаційними видами діяльності. Виникає питання: чому вихователі і батьки спокійно жертвують часом для гри на користь будьякої іншої діяльності Чому дорослі позбавляють малюків можливості грати з однолітками Педагогічна дискусія. Вихователь зобов'язаний направляти гру не руйнуючи її зберігаючи самостійний і творчий характер ігрової діяльності дітей безпосередність переживань віру в правду гри.
53216. ЗАСТОСУВАННЯ ГРАФІКІВ З МОДУЛЕМ ДО РОЗВЯЗУВАННЯ РІВНЯНЬ І НЕРІВНОСТЕЙ З МОДУЛЕМ 132.5 KB
  Цього можна досягти якщо попередньо над даним рівнянням виконати деякі перетворення які приводять до рівняння еквівалентного початковому: такі перетворення інколи зводяться до перенесення деяких членів рівняння з однієї його частини в другу.
53217. Розв’язування систем рівнянь графічним способом 220.5 KB
  Мета уроку: закріпити та вдосконалити вміння розв’язувати системи рівнянь з двома невідомими графічним способом; розвивати вміння аналізувати; виховувати бажання працювати в групі культуру спілкування. Обладнання і методичний матеріал: комп’ютери програмний педагогічний засіб GRN1 роздатковий матеріал: а аркуші завдань для роботи на уроці тестові завдання картки консультації з прикладами розв’язування систем рівнянь у GRN1. Перевірити правильність виконання домашнього завдання звіренням...
53218. Линейная функция и её график 101 KB
  Дать учащимся представление о линейной функции вида у=kх в рассмотреть частный случай у= kх; формировать умение строить график линейной функции и выяснять отдельные характеристики линейной по её графику; развивать логическое мышление вычислительные навыки по табличным значениям находить соответствующие точки на координатной плоскости; развивать самообразовательную и информационную компетентность. Выполнение математического диктанта Вариант 1...
53219. Простейшие преобразования графиков функций 54.5 KB
  І красные Графики функций y=fxn n 0 Каждый учасник получает задание построить график функции: №1. х Каждый ученик построил график своей функции дома. Группа делает вывод преобразования графика своей функции. 15 минут работы – каждый ученик рассказывает построение графика своей функции.