40562

Деревья решений

Лабораторная работа

Информатика, кибернетика и программирование

Известно что обучающий контент делится на несколько категорий по виду аудитории пользователей. В данном случае для исследования аудитории пользователей была взята статистика Портала на 1000 человек. Категории пользователей: По возрасту: Младше 18 лет – 651; Старше 18 лет – 349; По виду учебного заведения: Из пользователей младше 18 лет учащимися школы являются 721; Из пользователей младше 18 лет учащимися ССУЗов являются 279; Из пользователей старше 18 лет учащиеся ССУЗов – 72; Из пользователей старше 18 лет студенты ВУЗов...

Русский

2013-10-17

263 KB

9 чел.

Лабораторная работа № 4

Деревья решений

Существует образовательный ресурс – ПОРТАЛ, ориентированный на довольно широкую потребительскую аудиторию, а именно: от школьников 7го класса до аспирантов ВУЗов. Компания, разрабатывающая Портал, испытывает финансовые трудности в условиях экономического кризиса, поэтому вынуждена выявить приоритетный путь дальнейшего развития, чтобы сохранить свою прибыль:

а) создать платную базу дополнительных курсов для подготовки к ЕГЭ, что по ожиданиям принесет чистую прибыль до 250 тыс. у.е. в месяц, вероятность такого исхода 0.7; в случае, если этот путь развития не реализуется, Компания может понести убытки до 100 тыс.у.е.;

б) создать на основе существующей платформы платную базу дополнительных курсов и олимпиад для поступления в ВУЗы, доход до 500 тыс. у.е. в месяц с вероятностью в 0.4; в случае отрицательного исхода убытки составят 300 тыс. у.е.;

в) развитие Компании, как и раньше, за счет дополнительных образовательных курсов (курсов повышения квалификации), но это повлечет за собой увольнение сотрудников, что приведет к снижению качества контента Портала и его работы, что может повлечь за собой убытки с вероятностью 0.6 в 50 тыс.у.е., но может сохранить чистый доход от работы Портала до 200 тыс. у.е. с вероятностью 0.4 соответственно.

Известно, что обучающий контент делится на несколько категорий по виду аудитории пользователей. В данном случае, для исследования аудитории пользователей была взята статистика Портала на 1000 человек.

Категории пользователей:

  •  По возрасту:
  •  Младше 18 лет – 65,1%;
  •  Старше 18 лет – 34,9%;
  •  По виду учебного заведения:
  •  Из пользователей младше 18 лет учащимися школы являются 72,1%;
  •  Из пользователей младше 18 лет учащимися ССУЗов являются 27,9%;
  •  Из пользователей старше 18 лет учащиеся ССУЗов – 7,2%;
  •  Из пользователей старше 18 лет студенты ВУЗов – 82,8%;
  •  Из пользователей старше 18 лет аспиранты – 10%;

Известен еще один параметр (для исследования путей развития деятельности Компании) – потребность в дополнительных курсах у пользовательской  аудитории. Эта потребность включает в себя следующее:

  •  Потребность в подготовке к ЕГЭ – 100% среди всех школьников и 45% учащихся ССУЗов;
  •  Поступление в ВУЗы – 73,4% от выпускников школы; следовательно, это потенциальная аудитория для Интернет-олимпиад для поступления в ВУЗы. Среди учащихся ССУЗов такая потребность – у 63% учащихся.
  •  Потребность студентов и аспирантов в дополнительных курсах (например, повышение квалификации) составляет примерно 50% .

В соответствии с этими данными, необходимо поострить дерево классификации, в котором были бы учтены все параметры исследования аудитории, и выяснить, какую категорию пользователей целесообразно оставлять на Портале и по какому пути пойдет дальнейшее её развитие.

Затем достроить это дерево с учетом возможных исходов, определить оценки узлов и выявить наиболее оптимальный путь развития Компании.

Решение.

Исследование аудитории будет проводиться на основании следующих атрибутов: возраст, вид учебного заведения, потребность в курсах дополнительного образования (подготовка к ЕГЭ, поступление в ВУЗы, иные; иные курсы на рисунке 6 не обозначены, ветви просто выходят из узлов дерева со значениями процента потребности у данных аудиторий).

По данным из условия рисуем следующее дерево классификаций (см. рис.6). Начинаем с первого узла (атрибут) «Возраст»

Рис.7 – Первый этап решения задачи. Построение дерева классификаций

На первом уровне разбиваем дерево по 2м параметрам: аудитория младше 18 лет и старше (атрибут «Возраст»). Выставляем процентное соотношение.

На втором уровне делим каждую ветвь предыдущего уровня на соответствующие условию задачи ветви (по атрибуту «Вид учебного заведения»).

На третьем уровне разбиваем аудиторию по параметру «Потребность». Поскольку большой процент школьников и студентов используют, как показало исследование Портал в образовательных целях, а также заинтересовано в дополнительных курсах, мы не отсекаем ни одной ветви, потому что каждая категория для Компании имеет интерес. Здесь появляются 3 узла:

  •  А – узел, после которого идет развитие по стратегии «ЕГЭ» (пункт а в условии);
  •  В – узел, после которого Компания развивается за счет платных олимпиад;
  •  С – узел, после которого Компания претерпевает изменения в составе сотрудников.

Далее, достраиваем дерево решений с учетом оценок и вероятностей (см. рис. 7).

Теперь считаем оценки:

EMV(A) = 0.7*250 + 0.3*(-100) = 145;

EMV(B) = 0.4*500 + 0.6*(-300) = 20;

EMV(C) = 0.4*200 + 0.6*(-50) = 50;

Для выбора наиболее выгодного пути развития Компании выбираем максимальную оценку.

Вывод:

Таким образом, наиболее выгодный путь развития Компании, на основе исследования аудитории и расчета оценок предложенных путей развития – это стратегия «ЕГЭ», т.е. создание платной базы дополнительных курсов для подготовки к ЕГЭ без увольнения кого-либо из персонала.

Рис.8 – Достроенное дерево решений

Задание на лабораторную работу

Задание и методические рекомендации

Исследовать аудиторию пользователей (клиентов) и выбрать на основе исследования наиболее выгодный (приоритетный, перспективный) путь развития продукта.

  1.  Выявить атрибуты исследования в задаче.
  2.  На основе атрибутов построить дерево классификации.
  3.  Сделать выводы по каждой из ветвей на основании логики результатов построения: если вероятность (процент) благоприятных событию факторов больше, чем вероятность негативных, то событие реализуется. Если наоборот, то ветвь дерева отсекается и исследование проводится по оставшимся ветвям.
  4.  Рассчитать стоимостные оценки исходя из условия задачи. Сделать соответствующие выводы.
  5.  Деревья необходимо строить до 3-4го уровня (в зависимости от условия, включая 4й уровень).

Вариант 1.

Существует образовательный ресурс, ориентированный на довольно широкую потребительскую аудиторию, а именно: от студентов до преподавателей и людей, стремящихся к знаниям. Компания, разрабатывающая ресурс, испытывает трудности, поэтому вынуждена выявить приоритетный путь дальнейшего развития:

а) создать платную базу дополнительных курсов для подготовки сугубо студенческой аудитории по базовым дисциплинам: Математика, История и т.п., что по ожиданиям принесет чистую прибыль до 400 тыс. у.е. в месяц, вероятность такого исхода 0.7; в случае, если этот путь развития не реализуется, Компания может понести убытки до 100 тыс.у.е.;

б) развитие Компании, как и раньше, за счет дополнительных образовательных курсов (курсов повышения квалификации), но по сниженным ценам, чтобы повысить число пользователей, упавшее за последний месяц. В этом случае доход составит лишь 200 тыс. у.е. с вероятностью в 0.9, но может повлечь убытки в 75 тыс. у.е.

Известно, что обучающий контент делится на несколько категорий по виду аудитории пользователей. В данном случае, для исследования аудитории пользователей была взята статистика на 1000 человек.

Категории пользователей:

  •  По возрасту:
  •  17-30 лет – 62,3%;
  •  30-45 лет – 34,9%;
  •  По виду деятельности:
  •  Студенты младших курсов являются 34,1% (17-30 лет);
  •  Студенты старших курсов являются 27,9% (17-30 лет);
  •  Преподаватели (17-30 лет) – 7,2%;
  •  Прочие (17-30 лет) – 32,8%;
  •  Преподаватели (30-45 лет) – 62,8%;
  •  Прочие (30-45) – 37,2%;

Известен еще один параметр (для исследования путей развития деятельности Компании) – потребность в дополнительных курсах у пользовательской  аудитории. Эта потребность включает в себя следующее:

  •  Потребность в подготовке к экзаменам – 98% среди всех студентов младших курсов (базовые предметы), 67% среди студентов старших курсов (часть базовых предметов);
  •  Повышение квалификации – 73,4% от преподавателей 30-45 лет, 64% от преподавателей 17-30 лет;
  •  Потребность студентов в дополнительных курсах (например, дополнительное образование) составляет примерно 50%.

В соответствии с этими данными, необходимо поострить дерево классификации, в котором были бы учтены все параметры исследования аудитории, и выяснить, какую категорию пользователей целесообразно оставлять на ресурсе и по какому пути пойдет дальнейшее её развитие.

Затем достроить это дерево с учетом возможных исходов, определить оценки узлов и выявить наиболее оптимальный путь развития Компании.

Вариант 2.

Издательство занимается выпуском литературы различного рода: от школьных учебников, до художественной литературы. Но, в условиях современного рынка у Издательства большое количество конкурентов и зачастую при прежней стратегии развития у Издательства небольшой доход – 1 млн. в мес., но с вероятностью в 1.

В связи с большой конкуренцией руководство  Издательства приняло решение об изменении стратегии в соответствии с данными о потребительской аудитории.

А). Если Издательство оставит среди своей продукции только художественную литературу и будет специализироваться на выпуске редких и дорогих изданий, то доход составит 1 млн. в мес. с вероятностью в 0.5 и убытки составят 300 тыс.

Б).  Сконцентрироваться на выпуске сугубо образовательной литературы, что принесет доход в 1.5 млн. с вероятностью в 0.3, но может повлечь убытки в 750 тыс.

Об аудитории известно следующее:

  •  Возраст аудитории от 12 до 65 лет;
  •  Процент аудитории 12-38 лет – 76%;
  •  Процент аудитории 38-65 лет – 24%;
  •  Потребность в образовательной литературе у возрастных групп: 12-27 – 100%, 27-38 – 14,4%, 38-50 – 11,2; 50-65 – 3%;
  •  Потребность в художественной литературе соответственно: 45%, 40%, 36%, 42%.
  •  Коллекционерами являются соответственно: 2%, 24%, 32%, 17%.

В соответствии с этими данными, необходимо поострить дерево классификации, в котором были бы учтены все параметры исследования аудитории, и выяснить, с учетом оценок узлов наиболее оптимальный путь развития Компании.

Вариант 3.

Какие сервисы выгодно использовать в социальных сетях типа «Вконтакте» или «Одноклассники»?

Возможные варианты: сервис знакомств, сервис подарков, сервис игр, сервис поиска работы.

Чтобы ответить на этот вопрос, необходимо сначала исследовать аудиторию социальных сетей на возрастные категории. Известно, что аудитория пользователей социальных сетей – от 12 до 60 лет. Для удобства аудиторию можно разбить на две части: 12-36 лет и 36-60 лет.

  •  12-36 лет
  •  Мужчины 45%;
  •  Женщины 55%;
  •  36-60 лет
  •  Мужчины 34%;
  •  Женщины 66%;

Сфера деятельности:

  •  Студенты и учащиеся (мужчины, 12-36) 64%;
  •  Студенты и учащиеся (женщины, 12-36) 57%;
  •  Государственные служащие и работники (мужчины,12-36) 12%;
  •  Государственные служащие и работники (женщины,12-36) 5%;
  •  Государственные служащие и работники (мужчины, 36-60) 17%;
  •  Государственные служащие и работники (женщины,12-36) 14%;
  •  Имеющие профессию – работающие (мужчины, 12-36) 23%;
  •  Имеющие профессию – работающие (женщины, 12-36) 18%;
  •  Имеющие профессию – работающие (мужчины, 36-60) 90%;
  •  Имеющие профессию – работающие (женщины, 36-60) 90%;

Как правило, работающая аудитория – дееспособная и способная заплатить за какие-либо сервисы. Гос.служащие – люди очень занятые и серьезные.

  •  Одинокие (мужчины, 12-36) 60%;
  •  Одинокие (женщины, 12-36) 73%;
  •  Одинокие (мужчины, 36-60) 30%;
  •  Одинокие (женщины, 36-60) 20%;

«Одинокие» - потенциальная аудитория для пользования сервисами подарков и знакомств. Неработающие – для сервиса поиска работы, а также сервиса игр. Кроме того, сервисом игр активно могут интересоваться студенты.

Для того, чтобы определить, какой из сервисов в первую очередь стоит разработать, необходимо нарисовать дерево классификаций и выбрать ту ветку, процентное соотношение по которой больше или меньше в зависимости от условий исследования аудитории.

Вариант 4.

Какие сервисы выгодно использовать в социальных сетях типа «Вконтакте» или «Одноклассники»?

Возможные варианты: сервис знакомств, сервис подарков, сервис игр, сервис поиска работы.

Чтобы ответить на этот вопрос, необходимо сначала исследовать аудиторию социальных сетей на возрастные категории. Известно, что аудитория пользователей социальных сетей – от 12 до 60 лет. Для удобства аудиторию можно разбить на две части: 12-36 лет и 36-60 лет.

  •  12-36 лет
  •  Мужчины 60%;
  •  Женщины 40%;
  •  36-60 лет
  •  Мужчины 23%;
  •  Женщины 76%;

Сфера деятельности:

  •  Студенты и учащиеся (мужчины, 12-36) 34%;
  •  Студенты и учащиеся (женщины, 12-36) 21%;
  •  Государственные служащие и работники (мужчины,12-36) 10%;
  •  Государственные служащие и работники (женщины,12-36) 15%;
  •  Государственные служащие и работники (мужчины, 36-60) 19%;
  •  Государственные служащие и работники (женщины,12-36) 4%;
  •  Имеющие профессию – работающие (мужчины, 12-36) 20%;
  •  Имеющие профессию – работающие (женщины, 12-36) 13%;
  •  Имеющие профессию – работающие (мужчины, 36-60) 79%;
  •  Имеющие профессию – работающие (женщины, 36-60) 55%;

Как правило, работающая аудитория – дееспособная и способная заплатить за какие-либо сервисы. Гос.служащие – люди очень занятые и серьезные.

  •  Одинокие (мужчины, 12-36) 6%;
  •  Одинокие (женщины, 12-36) 73%;
  •  Одинокие (мужчины, 36-60) 30%;
  •  Одинокие (женщины, 36-60) 80%;

«Одинокие» - потенциальная аудитория для пользования сервисами подарков и знакомств. Неработающие – для сервиса поиска работы, а также сервиса игр. Кроме того, сервисом игр активно могут интересоваться студенты.

Для того, чтобы определить, какой из сервисов в первую очередь стоит разработать, необходимо нарисовать дерево классификаций и выбрать ту ветку, процентное соотношение по которой больше или меньше в зависимости от условий исследования аудитории.

Вариант 5.

Издательство занимается выпуском литературы различного рода: от школьных учебников, до художественной литературы. Но, в условиях современного рынка у Издательства большое количество конкурентов и зачастую при прежней стратегии развития у Издательства небольшой доход – 1.3 млн. в мес., но с вероятностью в 1.

В связи с большой конкуренцией руководство  Издательства приняло решение об изменении стратегии в соответствии с данными о потребительской аудитории.

А). Если Издательство оставит среди своей продукции только художественную литературу и будет специализироваться на выпуске редких и дорогих изданий, то доход составит 1 млн. в мес. с вероятностью в 0.7 и убытки составят 300 тыс.

Б).  Сконцентрироваться на выпуске сугубо образовательной литературы, что принесет доход в 1.2 млн. с вероятностью в 0.6, но может повлечь убытки в 600 тыс.

Об аудитории известно следующее:

  •  Возраст аудитории от 12 до 65 лет;
  •  Процент аудитории 12-38 лет – 60%;
  •  Процент аудитории 38-65 лет – 40%;
  •  Потребность в образовательной литературе у возрастных групп: 12-27 – 100%, 27-38 – 32%, 38-50 – 31; 50-65 – 12%;
  •  Потребность в художественной литературе соответственно: 67%, 53%, 36%, 62%.
  •  Коллекционерами являются соответственно: 1%, 4%, 32%, 17%.

В соответствии с этими данными, необходимо поострить дерево классификации, в котором были бы учтены все параметры исследования аудитории, и выяснить, с учетом оценок узлов наиболее оптимальный путь развития Компании.

Вариант 6.

Существует образовательный ресурс, ориентированный на довольно широкую потребительскую аудиторию, а именно: от студентов до преподавателей и людей, стремящихся к знаниям. Компания, разрабатывающая ресурс, испытывает трудности, поэтому вынуждена выявить приоритетный путь дальнейшего развития:

а) создать платную базу дополнительных курсов для подготовки сугубо студенческой аудитории по базовым дисциплинам: Математика, История и т.п., что по ожиданиям принесет чистую прибыль до 500 тыс. у.е. в месяц, вероятность такого исхода 0.7; в случае, если этот путь развития не реализуется, Компания может понести убытки до 250 тыс.у.е.;

б) развитие Компании, как и раньше, за счет дополнительных образовательных курсов (курсов повышения квалификации), но по сниженным ценам, чтобы повысить число пользователей, упавшее за последний месяц. В этом случае доход составит лишь 400 тыс. у.е. с вероятностью в 0.9, но может повлечь убытки в 150 тыс. у.е.

Известно, что обучающий контент делится на несколько категорий по виду аудитории пользователей. В данном случае, для исследования аудитории пользователей была взята статистика на 1000 человек.

Категории пользователей:

  •  По возрасту:
  •  17-30 лет – 55%;
  •  30-45 лет – 45%;
  •  По виду деятельности:
  •  Студенты младших курсов являются 30% (17-30 лет);
  •  Студенты старших курсов являются 23% (17-30 лет);
  •  Преподаватели (17-30 лет) – 5%;
  •  Прочие (17-30 лет) – 52%;
  •  Преподаватели (30-45 лет) – 62,8%;
  •  Прочие (30-45) – 37,2%;

Известен еще один параметр (для исследования путей развития деятельности Компании) – потребность в дополнительных курсах у пользовательской  аудитории. Эта потребность включает в себя следующее:

  •  Потребность в подготовке к экзаменам – 100% среди всех студентов младших курсов (базовые предметы), 45% среди студентов старших курсов (часть базовых предметов);
  •  Повышение квалификации – 75% от преподавателей 30-45 лет, 100% от преподавателей 17-30 лет;
  •  Потребность студентов в дополнительных курсах (например, дополнительное образование) составляет примерно 50%.

В соответствии с этими данными, необходимо поострить дерево классификации, в котором были бы учтены все параметры исследования аудитории, и выяснить, какую категорию пользователей целесообразно оставлять на ресурсе и по какому пути пойдет дальнейшее её развитие.

Затем достроить это дерево с учетом возможных исходов, определить оценки узлов и выявить наиболее оптимальный путь развития Компании.


 

А также другие работы, которые могут Вас заинтересовать

37771. Методы защиты информации от утечки по опто виброакустическому каналу 534 KB
  УЧЕБНОЕ ПОСОБИЕ для студента по выполнению лабораторной работы № 2 по учебной дисциплине Инженернотехническая защиты информации Тема: Методы защиты информации от утечки по опто виброакустическому каналу Занятие: Исследование активных методов защиты защищаемого помещения от утечки речевой информации за счет каналов утечки речевой информации на основе волоконнооптических коммуникаций. Обсуждено на заседании кафедры ФЗИ РГГУ ____ ________ 2007 года протокол № ____ Москва – 2007 Тема: Методы защиты защищаемого помещения ЗП от...
37772. УНИПОЛЯРНЫЙ ТРАНЗИСТОР В ШИРОКОПОЛОСНОМ УСИЛИТЕЛЬНОМ КАСКАДЕ С КС -СВЯЗЯМИ 141.75 KB
  От положения рабочей точки транзистора усилительного каскада зависят параметры транзистора а следовательно и параметры усилителя такие например как коэффициент усиления по напряжению ^и0 допустимая величина входного напряжения Цвхмакс превышение которой ведет к искажению выходного сигнала коэффициент полезного действия и т. Соответственно высшая граничная частота Гв полоса пропускания усилителя определяется как в = Расширить полосу пропускания усилителя в условиях...
37773. ОПРЕДЕЛЕНИЕ МОДУЛЯ ДЕФОРМАЦИИ ГРУНТА И ХАРАКТЕРА РАЗВИТИЯ ДЕФОРМАЦИИ ГРУНТОВ ВО ВРЕМЕНИ 94.5 KB
  Цель лабораторной работы – определить модуль деформации песчаного и глинистого грунтов. Коэффициент сжимаемости. Коэффициент относительной сжимаемости...
37775. Основні характеристики схем включення біполярного транзистора зі спільною базою (СБ) і спільним коллектором (СК) 365 KB
  Визначити коефіцієнт підсилення за струмом і напругою. Так як характеристики носять нелінійній характер то вони відображаються у вигляді графіків на яких маю маємо змогу наочно переконатися у тому що для схемы зі спільною базою підсилення за струмом не спостерігається але значно більше має місце підсилення за напругою у той час як схема зі спільним колектором підсилення за струмом має значне але підсилення за напругою не настільки значне.
37778. Исследование генераторного оборудования и системы синхронизации аппаратуры ИКМ-30 3.7 MB
  Цель работы. Изучение и исследование работы генераторного оборудования и режимов работы системы синхронизации аппаратуры ИКМ30. Исследование работы генераторного оборудования Для разрядного делителя fT Р1 Р2 Р8 Для канального делителя Для делителя циклов Исследование работы ДК Р2 упр. Т1 РС2 КИ1 КИ2 Исследование режимов работы приемника цикловой синхронизации Помеха 0 Г2 Г3 Г4Г8 Помеха 1 Г2 Г3 Г4 Г5 Г6Г8 Г9 Помеха 2 Г2 Г3 Г4 Г5 Г6 Г7Г8 Г9 Помеха 3 Г2 Г3 Г4 Г5 Г6 Г7 Г8 Г9 Помеха 4 Г2 Г3 Г4 Г5 Г6 Г7 Г8 Г9.
37779. Расчет перевозки коммерческого груза одним рейсом 45 KB
  Время необходимое для перевозки груза одним рейсом определяется по формулам: а наземным транспортом T = LА Tвсп Tпр [ч] V где LА – дальность перевозки груза автомобильным транспортом; V – скорость движения автомобильного транспорта; Tвсп – вспомогательное время; Tпр – суммарное время затрачиваемое на привалы. Вспомогательное...