91643

Критерии выбора уровня агрегации

Доклад

Информатика, кибернетика и программирование

Например вы не только сможете оценить какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня но на основе анализа истории и структуры автомобильного рынка в более развитых с точки зрения автомобилизации регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах. День 365 10 = 3650 различных значений 2. Менеджер 300 различных значений 3. Модель Автомобиля 100 различных значений 4.

Русский

2015-07-21

38.52 KB

0 чел.

Критерии выбора уровня агрегации

Если спросить пользователя, какой уровень детализации ему желателен, он не задумываясь ответит - максимально возможный. Однако стоит оценить, сколько такое решение может стоить, и попытаться определить возможный экономический эффект от наличия данных на каждом новом уровне детализации.

Например, выбрав в качестве уровня агрегации Год, вы получите возможность проанализировать общие тенденции автомобильного рынка и спрогнозировать динамику его развития. Выбрав же в качестве уровня агрегации Месяц или Неделю, вы, кроме того, сможете спрогнозировать спрос на конкретные модели в конкретные моменты времени. И хотя автомобили - товар не сезонный, скорее всего, весной и летом их покупают больше, чем осенью и зимой. Это позволит отследить возможные сезонные колебания, рациональнее формировать свой склад и более эффективно проводить политику формирования сезонных скидок и распродаж. А если в систему введена информация о затратах на маркетинг, появится возможность проследить эффект от каждого конкретного маркетингового мероприятия.

Выбор в качестве уровня агрегации Номер Контракта/Счета позволит перейти на качественно новый уровень анализа. На этом уровне можно будет учитывать взаимосвязи между конкретным Автомобилем, Менеджером и Покупателем. А поскольку при покупке автомобиля заполняется множество документов, то доступна достаточно детальная информация о каждом конкретном Покупателе (Возраст, Пол, Место жительства, Вид оплаты и т.д.). Теперь вы сможете проанализировать не только рынок, но и заглянуть внутрь своей фирмы и всесторонне проанализировать эффективность работы каждого Менеджера и Подразделения. Но наиболее ценное, что вы получаете, - это информация о Регионах и Покупателях. Например, вы не только сможете оценить, какие Модели автомобилей пользуются наибольшим спросом в конкретном регионе сегодня, но на основе анализа истории и структуры автомобильного рынка в более развитых, с точки зрения автомобилизации, регионах попытаться оценить динамику спроса и перспективы различных Моделей в остальных регионах.

Однако переход на каждый следующий уровень детализации и добавление новых источников данных могут привести к увеличению, иногда более чем на порядок, размера целевой МБД и соответствующему удорожанию и усложнению аппаратного решения.

Рассмотрим в качестве примера Показатель Объем продаж. Анализ предметной области показывает, что он однозначно определяется комбинацией четырех Измерений:

1. {Год | Полугодие | Квартал | Месяц | Неделя | День | Счет}

2. {Страна | Регион | Филиал | Менеджер}

3. {Фирма-Производитель | Завод-Производитель | Модель Автомобиля}

4. {Тип скидки}

Выбрав уровень детализации:

1. День (365 * 10 = 3650 различных значений),

2. Менеджер (300 различных значений),

3. Модель Автомобиля (100 различных значений),

4. Тип Скидки (4 различных значения),

получим куб, состоящий из 438000000 ячеек. Но в основе используемого в МСУБД способа хранения данных лежит предположение о том, что внутри, в данном случае четырехмерного гиперкуба, нет пустот. Данные в МСУБД представлены в виде разреженных матриц с заранее фиксированной размерностью. При этом значения Показателей хранятся в виде множества логически упорядоченных блоков (массивов), имеющих фиксированную длину, причем именно блок является минимальной индексируемой единицей.

Таким образом, в нашей БД будет сразу же зарезервировано место для всех 438 млн. значений Показателя Объем Продаж. Причем цифры "300 менеджеров" и "100 моделей автомобилей" вовсе не означают того, что сегодняшняя номенклатура фирмы - 100 различных моделей, которые продают 300 человек. Цифра 300 говорит о том, что в фирме за 10 лет ее существования работало 300 различных менеджеров. Сегодня же их может быть, например, всего 30.

Попробуем оценить, какой процент ячеек в нашем случае будет содержать реальные значения. Предположим, что в среднем в фирме постоянно работает около 30 менеджеров, менеджер продает в день 10 различных моделей и при продаже каждого автомобиля может быть использован только один вариант скидки. Тогда 3650 * 30 * 10 * 1 = 1095000. То есть только 0,25% ячеек куба будет содержать реальные значения данных. И хотя в МСУБД обычно предполагается, что блоки, полностью заполненные неопределенными значениями, не хранятся, как правило, это не обеспечивает полного решения проблемы.


 

А также другие работы, которые могут Вас заинтересовать

36959. Спрощена інструкція по роботі з інформаційною системою для бізнес-планування Project Expert 790 KB
  Вікно Новый проект назву проекту наприклад Проект підприємства з випуску офісних меблів; варіант довільну назву варіанта наприклад: 1 або Оптимістичний; прізвище автора код спеціальності та номер групи наприклад Іванов І. В результаті з’явиться робоче вікно Содержание рис. Робоче вікно Содержание Примітка: протягом подальшої роботи над проектом слід час від часу зберігати файл проекту. Робоче вікно Валюта проекта 2.
36960. Графічне представлення розподілів за допомогою функції «Гистограмма» 51.5 KB
  Загальні відомості Функція Гистограмма із пакету Анализ данных використовується для обчислення вибіркових і інтегральних частот попадання даних у вказані інтервали значень. Використання функції Гистограмма припускає існування трьох масивів: Входной интервал елементи таблиці де розміщені дані вибірки Интервал карманов елементи таблиці що вказують як вибираються інтервали згуртовування частот вибірки Выходной интервал це елементи таблиці куди буде виведений розподіл згрупованих частот. Завдання: Створити вибірку ціни у...
36961. Аналіз наукової, теоретичної та методичної літератури 62 KB
  Поглибити знання з Основ наукових досліджень щодо класифікації використання джерел наукової інформації.Виробити вміння аналізувати джерела наукової інформації та розвивати наукове мислення.Класифікація джерел наукової інформації. Опрацювати одне з джерел наукової інформації на вибір студента за планом: 1.
36962. Операційна система Microsoft Windows. Робота з файлами, вікнами. Програма Провідник 5.4 MB
  Мета: Сформувати практичні вміння та навички роботи з інтерфейсом та файлами операційної системи Microsoft Windows. Вміти: вмикати та вимикати комп’ютер з встановленою ОС Windows; управляти роботою ПК за допомогою маніпулятора мишка та клавіатури; викликати та використовувати пункти головного меню; працювати з відкритими вікнами та управляти відображенням їх вмісту; розпізнавати зовнішні пристрої під’єднані до комп’ютера; розрізняти об’єкти папка файл ярлик; знаходити потрібні файли за певними критеріями; використовувати...
36963. Робота з базою знань «План-карта шляхів» 40 KB
  COM командою lod ‘edit Сформувати файл програми для роботи з базою знань defun можливо стан карта mpcn 'lmbd правило if eql стан cr правило list правило nil карта defun вглибину поточнийплан ppend можливо cdr cr поточнийплан план1...
36964. Комп’ютера, як мультимедійний центр 183.74 KB
  Теоретичні відомості Програма Windows Movie Mker призначена для створення слайдівфільмів і відеокліпів на основі записаного вихідного матеріалу. Відкриття програми Windows Movie Mker Пуск Все программы Windows Movie Mker. або Пуск Все программыСтандартныеWindows Movie Mker. Програми Windows Movie Mker дозволяє записувати на комп'ютер зображення і звук з таких пристроїв як відеокамера цифрова чи аналогова відеокасета звичайна антена сигнал кабельного чи супутникового телебачення.
36965. Створення Windows Forms додатків на мові програмування C# 35 KB
  Створити Windows Forms додаток для вирішення відповідної задачі для чого: Розробити необхідну структуру вхідних віхідних даних та діалогових вікон додатку в яких розмістити необхідні елементи керування. Розробити додаток Облік успішності студентів для оперативного обліку успішності студентів в сесію деканом заступниками декана і співробітниками деканату. Розробити додаток Особисті справи студентів для отримання відомостей про студентів співробітниками деканату профкому і відділу кадрів. Розробити додаток Філіали банків .
36966. Дослідження базових схем підсілюваньніх каскадів на біполярніх транзисторах 284 KB
  Re емітерний опір Rl R2 резистори дільника що задає режим каскаду по постійному струму. Особливістю класичної схеми каскаду з СБ рис. Залежно від струму колектора транзистора і величини падіння напруги на електродах транзистора усилительного каскаду а також від амплітуди вхідного сигналу розрізняють наступні режими підсилення: режим А; режим В; режим С; режим D і проміжні режими наприклад АВ. Підсилювальний каскад по схемі з СЕ Для підсилювального каскаду класу А розрахунок статичного режиму полягає у виборі такого колекторного...