40562

Деревья решений

Лабораторная работа

Информатика, кибернетика и программирование

Известно что обучающий контент делится на несколько категорий по виду аудитории пользователей. В данном случае для исследования аудитории пользователей была взята статистика Портала на 1000 человек. Категории пользователей: По возрасту: Младше 18 лет 651; Старше 18 лет 349; По виду учебного заведения: Из пользователей младше 18 лет учащимися школы являются 721; Из пользователей младше 18 лет учащимися ССУЗов являются 279; Из пользователей старше 18 лет учащиеся ССУЗов 72; Из пользователей старше 18 лет студенты ВУЗов...

Русский

2013-10-17

263 KB

11 чел.

Лабораторная работа № 4

Деревья решений

Существует образовательный ресурс – ПОРТАЛ, ориентированный на довольно широкую потребительскую аудиторию, а именно: от школьников 7го класса до аспирантов ВУЗов. Компания, разрабатывающая Портал, испытывает финансовые трудности в условиях экономического кризиса, поэтому вынуждена выявить приоритетный путь дальнейшего развития, чтобы сохранить свою прибыль:

а) создать платную базу дополнительных курсов для подготовки к ЕГЭ, что по ожиданиям принесет чистую прибыль до 250 тыс. у.е. в месяц, вероятность такого исхода 0.7; в случае, если этот путь развития не реализуется, Компания может понести убытки до 100 тыс.у.е.;

б) создать на основе существующей платформы платную базу дополнительных курсов и олимпиад для поступления в ВУЗы, доход до 500 тыс. у.е. в месяц с вероятностью в 0.4; в случае отрицательного исхода убытки составят 300 тыс. у.е.;

в) развитие Компании, как и раньше, за счет дополнительных образовательных курсов (курсов повышения квалификации), но это повлечет за собой увольнение сотрудников, что приведет к снижению качества контента Портала и его работы, что может повлечь за собой убытки с вероятностью 0.6 в 50 тыс.у.е., но может сохранить чистый доход от работы Портала до 200 тыс. у.е. с вероятностью 0.4 соответственно.

Известно, что обучающий контент делится на несколько категорий по виду аудитории пользователей. В данном случае, для исследования аудитории пользователей была взята статистика Портала на 1000 человек.

Категории пользователей:

  •  По возрасту:
  •  Младше 18 лет – 65,1%;
  •  Старше 18 лет – 34,9%;
  •  По виду учебного заведения:
  •  Из пользователей младше 18 лет учащимися школы являются 72,1%;
  •  Из пользователей младше 18 лет учащимися ССУЗов являются 27,9%;
  •  Из пользователей старше 18 лет учащиеся ССУЗов – 7,2%;
  •  Из пользователей старше 18 лет студенты ВУЗов – 82,8%;
  •  Из пользователей старше 18 лет аспиранты – 10%;

Известен еще один параметр (для исследования путей развития деятельности Компании) – потребность в дополнительных курсах у пользовательской  аудитории. Эта потребность включает в себя следующее:

  •  Потребность в подготовке к ЕГЭ – 100% среди всех школьников и 45% учащихся ССУЗов;
  •  Поступление в ВУЗы – 73,4% от выпускников школы; следовательно, это потенциальная аудитория для Интернет-олимпиад для поступления в ВУЗы. Среди учащихся ССУЗов такая потребность – у 63% учащихся.
  •  Потребность студентов и аспирантов в дополнительных курсах (например, повышение квалификации) составляет примерно 50% .

В соответствии с этими данными, необходимо поострить дерево классификации, в котором были бы учтены все параметры исследования аудитории, и выяснить, какую категорию пользователей целесообразно оставлять на Портале и по какому пути пойдет дальнейшее её развитие.

Затем достроить это дерево с учетом возможных исходов, определить оценки узлов и выявить наиболее оптимальный путь развития Компании.

Решение.

Исследование аудитории будет проводиться на основании следующих атрибутов: возраст, вид учебного заведения, потребность в курсах дополнительного образования (подготовка к ЕГЭ, поступление в ВУЗы, иные; иные курсы на рисунке 6 не обозначены, ветви просто выходят из узлов дерева со значениями процента потребности у данных аудиторий).

По данным из условия рисуем следующее дерево классификаций (см. рис.6). Начинаем с первого узла (атрибут) «Возраст»

Рис.7 – Первый этап решения задачи. Построение дерева классификаций

На первом уровне разбиваем дерево по 2м параметрам: аудитория младше 18 лет и старше (атрибут «Возраст»). Выставляем процентное соотношение.

На втором уровне делим каждую ветвь предыдущего уровня на соответствующие условию задачи ветви (по атрибуту «Вид учебного заведения»).

На третьем уровне разбиваем аудиторию по параметру «Потребность». Поскольку большой процент школьников и студентов используют, как показало исследование Портал в образовательных целях, а также заинтересовано в дополнительных курсах, мы не отсекаем ни одной ветви, потому что каждая категория для Компании имеет интерес. Здесь появляются 3 узла:

  •  А – узел, после которого идет развитие по стратегии «ЕГЭ» (пункт а в условии);
  •  В – узел, после которого Компания развивается за счет платных олимпиад;
  •  С – узел, после которого Компания претерпевает изменения в составе сотрудников.

Далее, достраиваем дерево решений с учетом оценок и вероятностей (см. рис. 7).

Теперь считаем оценки:

EMV(A) = 0.7*250 + 0.3*(-100) = 145;

EMV(B) = 0.4*500 + 0.6*(-300) = 20;

EMV(C) = 0.4*200 + 0.6*(-50) = 50;

Для выбора наиболее выгодного пути развития Компании выбираем максимальную оценку.

Вывод:

Таким образом, наиболее выгодный путь развития Компании, на основе исследования аудитории и расчета оценок предложенных путей развития – это стратегия «ЕГЭ», т.е. создание платной базы дополнительных курсов для подготовки к ЕГЭ без увольнения кого-либо из персонала.

Рис.8 – Достроенное дерево решений

Задание на лабораторную работу

Задание и методические рекомендации

Исследовать аудиторию пользователей (клиентов) и выбрать на основе исследования наиболее выгодный (приоритетный, перспективный) путь развития продукта.

  1.  Выявить атрибуты исследования в задаче.
  2.  На основе атрибутов построить дерево классификации.
  3.  Сделать выводы по каждой из ветвей на основании логики результатов построения: если вероятность (процент) благоприятных событию факторов больше, чем вероятность негативных, то событие реализуется. Если наоборот, то ветвь дерева отсекается и исследование проводится по оставшимся ветвям.
  4.  Рассчитать стоимостные оценки исходя из условия задачи. Сделать соответствующие выводы.
  5.  Деревья необходимо строить до 3-4го уровня (в зависимости от условия, включая 4й уровень).

Вариант 1.

Существует образовательный ресурс, ориентированный на довольно широкую потребительскую аудиторию, а именно: от студентов до преподавателей и людей, стремящихся к знаниям. Компания, разрабатывающая ресурс, испытывает трудности, поэтому вынуждена выявить приоритетный путь дальнейшего развития:

а) создать платную базу дополнительных курсов для подготовки сугубо студенческой аудитории по базовым дисциплинам: Математика, История и т.п., что по ожиданиям принесет чистую прибыль до 400 тыс. у.е. в месяц, вероятность такого исхода 0.7; в случае, если этот путь развития не реализуется, Компания может понести убытки до 100 тыс.у.е.;

б) развитие Компании, как и раньше, за счет дополнительных образовательных курсов (курсов повышения квалификации), но по сниженным ценам, чтобы повысить число пользователей, упавшее за последний месяц. В этом случае доход составит лишь 200 тыс. у.е. с вероятностью в 0.9, но может повлечь убытки в 75 тыс. у.е.

Известно, что обучающий контент делится на несколько категорий по виду аудитории пользователей. В данном случае, для исследования аудитории пользователей была взята статистика на 1000 человек.

Категории пользователей:

  •  По возрасту:
  •  17-30 лет – 62,3%;
  •  30-45 лет – 34,9%;
  •  По виду деятельности:
  •  Студенты младших курсов являются 34,1% (17-30 лет);
  •  Студенты старших курсов являются 27,9% (17-30 лет);
  •  Преподаватели (17-30 лет) – 7,2%;
  •  Прочие (17-30 лет) – 32,8%;
  •  Преподаватели (30-45 лет) – 62,8%;
  •  Прочие (30-45) – 37,2%;

Известен еще один параметр (для исследования путей развития деятельности Компании) – потребность в дополнительных курсах у пользовательской  аудитории. Эта потребность включает в себя следующее:

  •  Потребность в подготовке к экзаменам – 98% среди всех студентов младших курсов (базовые предметы), 67% среди студентов старших курсов (часть базовых предметов);
  •  Повышение квалификации – 73,4% от преподавателей 30-45 лет, 64% от преподавателей 17-30 лет;
  •  Потребность студентов в дополнительных курсах (например, дополнительное образование) составляет примерно 50%.

В соответствии с этими данными, необходимо поострить дерево классификации, в котором были бы учтены все параметры исследования аудитории, и выяснить, какую категорию пользователей целесообразно оставлять на ресурсе и по какому пути пойдет дальнейшее её развитие.

Затем достроить это дерево с учетом возможных исходов, определить оценки узлов и выявить наиболее оптимальный путь развития Компании.

Вариант 2.

Издательство занимается выпуском литературы различного рода: от школьных учебников, до художественной литературы. Но, в условиях современного рынка у Издательства большое количество конкурентов и зачастую при прежней стратегии развития у Издательства небольшой доход – 1 млн. в мес., но с вероятностью в 1.

В связи с большой конкуренцией руководство  Издательства приняло решение об изменении стратегии в соответствии с данными о потребительской аудитории.

А). Если Издательство оставит среди своей продукции только художественную литературу и будет специализироваться на выпуске редких и дорогих изданий, то доход составит 1 млн. в мес. с вероятностью в 0.5 и убытки составят 300 тыс.

Б).  Сконцентрироваться на выпуске сугубо образовательной литературы, что принесет доход в 1.5 млн. с вероятностью в 0.3, но может повлечь убытки в 750 тыс.

Об аудитории известно следующее:

  •  Возраст аудитории от 12 до 65 лет;
  •  Процент аудитории 12-38 лет – 76%;
  •  Процент аудитории 38-65 лет – 24%;
  •  Потребность в образовательной литературе у возрастных групп: 12-27 – 100%, 27-38 – 14,4%, 38-50 – 11,2; 50-65 – 3%;
  •  Потребность в художественной литературе соответственно: 45%, 40%, 36%, 42%.
  •  Коллекционерами являются соответственно: 2%, 24%, 32%, 17%.

В соответствии с этими данными, необходимо поострить дерево классификации, в котором были бы учтены все параметры исследования аудитории, и выяснить, с учетом оценок узлов наиболее оптимальный путь развития Компании.

Вариант 3.

Какие сервисы выгодно использовать в социальных сетях типа «Вконтакте» или «Одноклассники»?

Возможные варианты: сервис знакомств, сервис подарков, сервис игр, сервис поиска работы.

Чтобы ответить на этот вопрос, необходимо сначала исследовать аудиторию социальных сетей на возрастные категории. Известно, что аудитория пользователей социальных сетей – от 12 до 60 лет. Для удобства аудиторию можно разбить на две части: 12-36 лет и 36-60 лет.

  •  12-36 лет
  •  Мужчины 45%;
  •  Женщины 55%;
  •  36-60 лет
  •  Мужчины 34%;
  •  Женщины 66%;

Сфера деятельности:

  •  Студенты и учащиеся (мужчины, 12-36) 64%;
  •  Студенты и учащиеся (женщины, 12-36) 57%;
  •  Государственные служащие и работники (мужчины,12-36) 12%;
  •  Государственные служащие и работники (женщины,12-36) 5%;
  •  Государственные служащие и работники (мужчины, 36-60) 17%;
  •  Государственные служащие и работники (женщины,12-36) 14%;
  •  Имеющие профессию – работающие (мужчины, 12-36) 23%;
  •  Имеющие профессию – работающие (женщины, 12-36) 18%;
  •  Имеющие профессию – работающие (мужчины, 36-60) 90%;
  •  Имеющие профессию – работающие (женщины, 36-60) 90%;

Как правило, работающая аудитория – дееспособная и способная заплатить за какие-либо сервисы. Гос.служащие – люди очень занятые и серьезные.

  •  Одинокие (мужчины, 12-36) 60%;
  •  Одинокие (женщины, 12-36) 73%;
  •  Одинокие (мужчины, 36-60) 30%;
  •  Одинокие (женщины, 36-60) 20%;

«Одинокие» - потенциальная аудитория для пользования сервисами подарков и знакомств. Неработающие – для сервиса поиска работы, а также сервиса игр. Кроме того, сервисом игр активно могут интересоваться студенты.

Для того, чтобы определить, какой из сервисов в первую очередь стоит разработать, необходимо нарисовать дерево классификаций и выбрать ту ветку, процентное соотношение по которой больше или меньше в зависимости от условий исследования аудитории.

Вариант 4.

Какие сервисы выгодно использовать в социальных сетях типа «Вконтакте» или «Одноклассники»?

Возможные варианты: сервис знакомств, сервис подарков, сервис игр, сервис поиска работы.

Чтобы ответить на этот вопрос, необходимо сначала исследовать аудиторию социальных сетей на возрастные категории. Известно, что аудитория пользователей социальных сетей – от 12 до 60 лет. Для удобства аудиторию можно разбить на две части: 12-36 лет и 36-60 лет.

  •  12-36 лет
  •  Мужчины 60%;
  •  Женщины 40%;
  •  36-60 лет
  •  Мужчины 23%;
  •  Женщины 76%;

Сфера деятельности:

  •  Студенты и учащиеся (мужчины, 12-36) 34%;
  •  Студенты и учащиеся (женщины, 12-36) 21%;
  •  Государственные служащие и работники (мужчины,12-36) 10%;
  •  Государственные служащие и работники (женщины,12-36) 15%;
  •  Государственные служащие и работники (мужчины, 36-60) 19%;
  •  Государственные служащие и работники (женщины,12-36) 4%;
  •  Имеющие профессию – работающие (мужчины, 12-36) 20%;
  •  Имеющие профессию – работающие (женщины, 12-36) 13%;
  •  Имеющие профессию – работающие (мужчины, 36-60) 79%;
  •  Имеющие профессию – работающие (женщины, 36-60) 55%;

Как правило, работающая аудитория – дееспособная и способная заплатить за какие-либо сервисы. Гос.служащие – люди очень занятые и серьезные.

  •  Одинокие (мужчины, 12-36) 6%;
  •  Одинокие (женщины, 12-36) 73%;
  •  Одинокие (мужчины, 36-60) 30%;
  •  Одинокие (женщины, 36-60) 80%;

«Одинокие» - потенциальная аудитория для пользования сервисами подарков и знакомств. Неработающие – для сервиса поиска работы, а также сервиса игр. Кроме того, сервисом игр активно могут интересоваться студенты.

Для того, чтобы определить, какой из сервисов в первую очередь стоит разработать, необходимо нарисовать дерево классификаций и выбрать ту ветку, процентное соотношение по которой больше или меньше в зависимости от условий исследования аудитории.

Вариант 5.

Издательство занимается выпуском литературы различного рода: от школьных учебников, до художественной литературы. Но, в условиях современного рынка у Издательства большое количество конкурентов и зачастую при прежней стратегии развития у Издательства небольшой доход – 1.3 млн. в мес., но с вероятностью в 1.

В связи с большой конкуренцией руководство  Издательства приняло решение об изменении стратегии в соответствии с данными о потребительской аудитории.

А). Если Издательство оставит среди своей продукции только художественную литературу и будет специализироваться на выпуске редких и дорогих изданий, то доход составит 1 млн. в мес. с вероятностью в 0.7 и убытки составят 300 тыс.

Б).  Сконцентрироваться на выпуске сугубо образовательной литературы, что принесет доход в 1.2 млн. с вероятностью в 0.6, но может повлечь убытки в 600 тыс.

Об аудитории известно следующее:

  •  Возраст аудитории от 12 до 65 лет;
  •  Процент аудитории 12-38 лет – 60%;
  •  Процент аудитории 38-65 лет – 40%;
  •  Потребность в образовательной литературе у возрастных групп: 12-27 – 100%, 27-38 – 32%, 38-50 – 31; 50-65 – 12%;
  •  Потребность в художественной литературе соответственно: 67%, 53%, 36%, 62%.
  •  Коллекционерами являются соответственно: 1%, 4%, 32%, 17%.

В соответствии с этими данными, необходимо поострить дерево классификации, в котором были бы учтены все параметры исследования аудитории, и выяснить, с учетом оценок узлов наиболее оптимальный путь развития Компании.

Вариант 6.

Существует образовательный ресурс, ориентированный на довольно широкую потребительскую аудиторию, а именно: от студентов до преподавателей и людей, стремящихся к знаниям. Компания, разрабатывающая ресурс, испытывает трудности, поэтому вынуждена выявить приоритетный путь дальнейшего развития:

а) создать платную базу дополнительных курсов для подготовки сугубо студенческой аудитории по базовым дисциплинам: Математика, История и т.п., что по ожиданиям принесет чистую прибыль до 500 тыс. у.е. в месяц, вероятность такого исхода 0.7; в случае, если этот путь развития не реализуется, Компания может понести убытки до 250 тыс.у.е.;

б) развитие Компании, как и раньше, за счет дополнительных образовательных курсов (курсов повышения квалификации), но по сниженным ценам, чтобы повысить число пользователей, упавшее за последний месяц. В этом случае доход составит лишь 400 тыс. у.е. с вероятностью в 0.9, но может повлечь убытки в 150 тыс. у.е.

Известно, что обучающий контент делится на несколько категорий по виду аудитории пользователей. В данном случае, для исследования аудитории пользователей была взята статистика на 1000 человек.

Категории пользователей:

  •  По возрасту:
  •  17-30 лет – 55%;
  •  30-45 лет – 45%;
  •  По виду деятельности:
  •  Студенты младших курсов являются 30% (17-30 лет);
  •  Студенты старших курсов являются 23% (17-30 лет);
  •  Преподаватели (17-30 лет) – 5%;
  •  Прочие (17-30 лет) – 52%;
  •  Преподаватели (30-45 лет) – 62,8%;
  •  Прочие (30-45) – 37,2%;

Известен еще один параметр (для исследования путей развития деятельности Компании) – потребность в дополнительных курсах у пользовательской  аудитории. Эта потребность включает в себя следующее:

  •  Потребность в подготовке к экзаменам – 100% среди всех студентов младших курсов (базовые предметы), 45% среди студентов старших курсов (часть базовых предметов);
  •  Повышение квалификации – 75% от преподавателей 30-45 лет, 100% от преподавателей 17-30 лет;
  •  Потребность студентов в дополнительных курсах (например, дополнительное образование) составляет примерно 50%.

В соответствии с этими данными, необходимо поострить дерево классификации, в котором были бы учтены все параметры исследования аудитории, и выяснить, какую категорию пользователей целесообразно оставлять на ресурсе и по какому пути пойдет дальнейшее её развитие.

Затем достроить это дерево с учетом возможных исходов, определить оценки узлов и выявить наиболее оптимальный путь развития Компании.


 

А также другие работы, которые могут Вас заинтересовать

37931. ИЗУЧЕНИЕ ГАЗОВОГО РАЗРЯДА 946 KB
  Цель работы Изучение газового разряда измерение вольтамперной характеристики газонаполненной лампы изучение релаксационных колебаний.2 Газонаполненные лампы часто используют для получения релаксационных колебаний. Принципиальная схема генератора релаксационных колебаний полказана на рисунке 2. При нажатой кнопке режим получается схема генератора релаксационных колебаний смотри рисунок 2.
37932. ИЗУЧЕНИЕ ДИЭЛЕКТРИЧЕСКИХ СВОЙСТВ СЕГНЕТОЭЛЕКТРИКОВ 1.1 MB
  Цель работы Изучение поляризации сегнетоэлектриков в зависимости от напряженности электрического поля E получение кривой E = fE изучение диэлектрического гистерезиса определение диэлектрических потерь в сегнетоэлектриках. Это связано с тем что они не содержат зарядов способных направленно перемещаться под действием электрического поля. Внешнее электрическое поле либо упорядочивает ориентацию жестких диполей ориентационная поляризация в диэлектриках с полярными молекулами либо приводит к появлению полностью упорядоченных...
37933. ОПРЕДЕЛЕНИЕ ЭДС ИСТОЧНИКА ТОКА С ПОМОЩЬЮ ЗАКОНА ОМА 199 KB
  Контрольные вопросы 11 Список литературы 11 ЛАБОРАТОРНАЯ РАБОТА № 45 ОПРЕДЕЛЕНИЕ ЭДС ИСТОЧНИКА ТОКА С ПОМОЩЬЮ ЗАКОНА ОМА Цель работы.1 Закон Ома Количественной мерой электрического тока служит сила тока скалярная величина определяемая электрическим зарядом проходящим через поперечное сечение проводника в единицу времени: . Для постоянного тока . Единица силы тока ампер 1 А = Кл с.
37934. Движения заряженных частиц в магнитном поле. Определение удельного заряда электрона методом магнетрона 365 KB
  Действие магнитного поля на движущийся заряд. Действие магнитного поля на движущийся заряд. Процесс взаимодействия магнитных полей исследовался Лоренцем который вывел формулу для расчета силы действующей со стороны магнитного поля на движущуюся заряженную частицу.2 Тогда на n движущихся зарядов со стороны магнитного поля действует сила равная .
37935. Определение горизонтальной составляющей магнитного поля земли. Методические указания 160.64 KB
  Методические указания предназначены для студентов, изучающих раздел курса общей физики «Электричество и магнетизм». Приведены основные положения геомагнетизма и методика экспериментального определения горизонтальной составляющей магнитного поля Земли с помощью тангенс гальванометра.
37936. Исследование затухающих колебаний в колебательном контуре 223.5 KB
  14 Лабораторная работа № 48 Исследование затухающих колебаний в колебательном контуре 1. Получим уравнение колебаний в контуре без активного сопротивления рисунок 2.3 получаем дифференциальное уравнение свободных колебаний в контуре без активного сопротивления 2.5 где φ начальная фаза колебаний.
37937. Изучение вынужденных колебаний в электрическом контуре 438.5 KB
  В теоретической части методических указаний изложены условия возникновения вынужденных колебаний в электрическом контуре выведено дифференциальное уравнение этого вида колебаний рассмотрены явления резонансных тока и напряжения. Для осуществления вынужденных колебаний в контур включают источник тока обладающий периодически изменяющейся ЭДС рис. в каждый момент времени сила тока во всех сечениях цепи одинакова. Перейдя от тока I к заряду q и введя обозначения: ω02=1 LС ...
37938. ИЗУЧЕНИЕ ЭЛЕКТРОНННО – ЛУЧЕВОГО ОСЦИЛЛОГРАФА 206.5 KB
  4 Устройство и принцип работы осциллографа.11 ЛАБОРАТОРНАЯ РАБОТА № 50 ИЗУЧЕНИЕ ЭЛЕКТРОНННО ЛУЧЕВОГО ОСЦИЛЛОГРАФА Цель работы Изучение устройства электронно лучевого осциллографа и знакомство с некоторыми видами наблюдений и измерений которые можно проводить с его помощью. Устройство и принцип работы осциллографа Осциллографы бывают различного типа и назначения. Например с помощью осциллографа можно найти силу тока и напряжение изучать зависимость силы тока и напряжения от времени измерять сдвиг фаз между ними сравнивать...
37939. Изучение свойств ферромагнетиков и явления магнитного гистерезиса для железа 202.5 KB
  Изучение магнитных свойств вещества. Расчет и построение кривой намагничивания, снятие петли гистерезиса и определение тепловых потерь на перемагничивание ферромагнетиков. Вычисление коэрцитивной силы и остаточной намагниченности изучаемого образца железа.