17626

Интерпретация результатов многофакторного моделирования

Лекция

Экономическая теория и математическое моделирование

Тема: Интерпретация результатов многофакторного моделирования Пример. Реклама в журналах. Название журнала Y тариф одна страница цветной рекламы дол. X1 планируемая аудитория тыс. че...

Русский

2013-07-05

156 KB

2 чел.

Тема:  «Интерпретация результатов многофакторного моделирования»

Пример. Реклама в журналах.

Название журнала

Y, тариф (одна страница цветной рекламы), дол.

X1, планируемая аудитория, тыс. человек

Х2, процент мужчин

Х3, медиана дохода семьи, дол

Audubon

25 315

1645

51,1

38 787

Better Homes & Gardens

198 000

34 797

22,1

41933

Business Week

103300

4760

68,1

63 667

Cosmopolitan

94100

15 452

17,3

44 237

Elle

55 540

3735

12,5

47 211

Entrepreneur

40 355

2 476

60,4

47 579

Esquire

51559

3037

71,3

44 715

Family Circle

147 500

24 539

13,0

38 759

first For Women

28 059

3 856

3,6

43 850

Forbes

59 340

4191

68,8

66 606

Fortune

60800

3 891

68,8

58 402

Glamour

85 080

10891

7,8

46331

Goff Digest

98760

6 250

78,9

61323

Good Housekeeping

166 080

25 306

12,6

38 335

Gourmet

49 640

4484

29,6

57 060

Harper's Bazaar

52 805

2 621

11,5

44 992

Inc.

70 825

2166

66,9

72493

Kiplinger's Personal Finance

46580

3332

65,1

63 876

Ladies' Home Journal

127 000

17040

6,8

38442

Life

63 750

14 220

46,9

41770

Mademoiselle

55 910

4804

8,0

46694

Martha Stewart's Living

93 328

4 849

16,6

61890

McCalls

113120

16301

7,6

33 823

Money

98 250

9805

60,6

60549

Motor Trend

79 800

5 281

88,5

48 739

National Geographic

159345

32158

53,0

44 326

Natural History

20180

1775

45,0

41499

Newsweek

148 800

20 720

53,5

53 025

Parents Magazine

72 820

12064

18,2

39369

PC Computing

40 675

4606

67,0

57 916

People

125 000

33 668

34,0

46171

Popular Mechanics

78685

9036

86,9

40802

Reader's Digest

193000

51925

42,4

38 060

Redbook

95 785

13 212

8,9

41 156

Rolling Stone

78 920

8 638

59,8

43 212

Runner's World

36 850

2 078

62,9

60 222

Scientific American

37 500

2 704

70,0

62372

Seventeen

71 115

5 738

17,0

37 034

Ski

32 480

2 249

64,5

58 629

Smart Money

42 900

2 224

63,4

57170

Smithsonian

73 075

8 253

47,9

50872

Soap Opera Digest

35 070

7 227

10,3

31835

Sports Illustrated

162 000

21602

78,8

45 897

Sunset

56 000

5 276

38,7

52 524

Teen

53 250

3 057

15,4

42640

The New Yorker

62 435

3 223

48,9

49672

Time

162 000

22 798

52,4

49166

True Story

17100

3582

12,2

15734

TV Guide

146400

40917

42,8

37 396

U.S. News & World Report

98 644

9 825

57,5

52 018

Vanity Fair

67 890

4 307

27,7

52189

Vogue

63 900

8434

12,9

44 242

Woman's Day

137 000

22 747

6,7

38463

Working Woman

87 500

3312

6,3

44 674

YM

73 270

3109

14,4

43 696

Среднее значение

83 534

10913

39,7

47 710

Среднеквадратичное  отклонение

45446

11212

25,9

10 225

Тарифы на размещение рекламных объявлений в журналах определяются каждым журналом самостоятельно. Чем объясняются различия в тарифах? Возможно, здесь каким-то образом учитывается ценность рекламного объявления для рекламодателя. Журналы, располагающие большей читательской аудиторией (при равных прочих условиях), наверное, вправе устанавливать большие тарифы. Кроме того, журналы, рассчитанные на более состоятельные круги читателей, также вправе устанавливать более высокие тарифы. Несмотря то что наверняка имеются и другие, не менее важные факторы, мы ограничимся лишь указанными двумя, добавив к ним еще один — предпочтения людей разного пола, и выясним, изменяют ли журналы свои тарифы в зависимости от соотношения мужчин и женщин в их читательской аудитории. Ответы на некоторые из этих вопросов можно получить с помощью множественного регрессионного анализа. Такой анализ поможет нам объяснить влияние на тарифы таких факторов, как величина читательской аудитории, структура читательской аудитории по полу и доходы читателей.

В табл. 3 представлена соответствующая многомерная совокупность данных, которую нам предстоит проанализировать. В качестве переменной У (объясняемой) мы будем рассматривать стоимость одной страницы одноразовой полноцветной рекламы. Объясняющими переменными будут Х1, читательская аудитория (планируемая в тысячах человек), Х2, процент мужчин среди планируемой аудитории, и Х3, медиана дохода семьи. Размер выборки n = 55.

В табл. 1 представлена компьютерная распечатка результатов анализа множественной регрессии. Например, с помощью Excel можно выполнить анализ множественной регрессии. Найдите пункт Data Analysis (Анализ данных) в меню Tools (Сервис) и выберите команду Regression (Регрессия). Если в меню Tools (Сервис) отсутствует пункт Data Analysis (Анализ данных), то сначала убедитесь, что вы выбрали ячейку электронной таблицы (а не график, например). Если вы все же не можете найти Data Analysis (Анализ данных), поищите пункт меню Add-Ins (Надстройки) и поставьте отметку возле Analysis ToolPak (Пакет анализа). Если это не поможет, то, видимо, необходимо переустановить Excel.

Таблица 1. Результат множественной регрессионного анализа тарифов на размещение рекламы в журналах (вычисления сделаны в Excel)

ВЫВОД ИТОГОВ

Регрессионная статистика

Множествен. R

0,887

R-квадрат

0,787

Нормированный

R-квадрат

0,775

Стандартная ошибка

21577,870

Наблюдения

55

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

3

87780733202

29260044401

62,843

0,000000

Остаток

51

23745829151

465604493

Итого

54

111525962353

Коэффициенты

Стандартная ошибка

t-статистика

P-значение

Нижние 95%

Верхние 95%

Y-пересечение

4042,799

16884,039

0,239

0,812

-29853,298

37938,895

Переменная X 1

3,788

0,281

13,484

0,000

3,224

4,352

Переменная X 2

-123,634

137,849

-0,897

0,374

-400,377

153,108

Переменная X 3

0,903

0,370

2,442

0,018

0,161

1,645

Коэффициенты регрессии и уравнение регрессии

Сдвиг, или постоянный член, а, и коэффициенты регрессии, b1, b2, и b3, вычисляются компьютером с использованием метода наименьших квадратов.

Среди всех возможных вариантов уравнения регрессии с различными значениями этих коэффициентов именно уравнение, найденное таким методом, обеспечивает минимальную сумму квадратов ошибок прогнозирования для рассматриваемой нами выборки журналов. Уравнение регрессии (или уравнение прогнозирования) имеет следующий вид:

(прогнозируемый тариф на размещение рекламы) = а + b1X1 + b2X2 + b3X3 =

= $4043 + 3,79(читательская аудитория) – 124(процент мужчин) + 0,903(медиана дохода).

Сдвиг, а = $4 043, интерпретируется следующим образом: типичный тариф на размещение одностраничного цветного рекламного объявления в журнале, у которого нет платных подписчиков, нет мужчин среди читателей и читатели не имеют дохода, составляет $4043. Однако в рассматриваемой нами совокупности данных нет подобных журналов, поэтому сдвиг, а, следует рассматривать лишь как вспомогательную величину, необходимую для получения оптимальных прогнозов, но не интерпретировать это значение так буквально.

Коэффициенты регрессии интерпретируются как влияние каждой из переменных на размер тарифа, если все другие независимые («объясняющие») переменные остаются неизменными. Часто это значение включает «поправку на» другие независимые переменные, или «контролирование» этих других независимых переменных. Поэтому коэффициент регрессии для конкретной X-переменной может изменяться (иногда значительно) в результате включения в анализ или исключения других Х- переменных. В частности, каждый коэффициент регрессии определяет среднее увеличение тарифа на размещение рекламы, приходящееся на единичное увеличение соответствующей ему Х- переменной (в данном случае термин «единичное» означает одну единицу измерения конкретной Х- переменной).

Коэффициент регрессии для размера читательской аудитории, b1=3,79, указывает, что – при всех прочих равных условиях – журнал с дополнительной тысячью читателей (поскольку у нас X1 измеряется в тысячах человек) берет (в среднем) на $3,79 больше за размещение одностраничного цветного рекламного объявления. Можно также считать, что коэффициент регрессии для размера читательской аудитории означает, что каждый дополнительный читатель увеличивает для этого журнала тариф на размещение рекламных объявлений на $0,00379, т.е. увеличение составляет чуть меньше половины цента на одного человека. Поэтому, если у какого-то другого журнала такой же процент читателей-мужчин и такой же показатель медианы дохода семьи читателей, но читательская аудитория на 3548 человек больше, то можно ожидать, что тариф на размещение рекламных объявлений в этом журнале будет (в среднем) на 3,79 × 3,548 = $13,45 больше благодаря такому отличию размера читательской аудитории.

Коэффициент регрессии для процента мужчин, b2 = -124, указывает, что (при всех прочих равных условиях) тариф на размещение цветных рекламных объявлений в журнале с дополнительным 1% читателей-мужчин окажется (в среднем) на $124 меньше. Это означает, что читательницы представляют для журнала большую ценность, чем читатели-мужчины. Статистический вывод должен подтвердить или опровергнуть эту гипотезу путем сравнения величины влияния процента мужчин (т.е. -$124) с тем, на что можно было бы рассчитывать, если бы при данных обстоятельствах все определялось лишь чистой случайностью.

Коэффициент регрессии для медианы дохода, b3 = 0,903, указывает, что (при всех прочих равных условиях) в журнале с дополнительным долларом медианы дохода его читателей тариф на размещение одностраничного цветного рекламного объявления будет (в среднем) на $0,903 больше. Положительный знак этого коэффициента совершенно оправдан, поскольку люди с более высоким уровнем доходов могут позволить себе тратить больше на покупку рекламируемой продукции. Если у какого-то другого журнала такой же процент читателей-мужчин и такая же величина читательской аудитории, но медиана дохода семей читателей на $4 000 выше, то можно ожидать, что тариф этого журнала на размещение рекламных объявлений будет на 0,903 × 4000 = $3612 выше (в среднем) благодаря более высокому уровню доходов его читателей.

Помните, что коэффициенты регрессии отражают влияние на Y одной X- переменной при условии, что все другие Х- переменные остаются неизменными. Это следует понимать буквально.

Например, коэффициент регрессии b3 отражает влияние медианы дохода читателей на рекламные тарифы; он вычисляется при неизменных величинах читательской аудитории и процента читателей-мужчин. В таком случае более высокие уровни доходов читателей, как правило, ведут к установлению более высоких тарифов на размещение рекламных объявлений (поскольку b3 является положительным числом) – при фиксированных размере читательской аудитории и проценте читателей-мужчин.

Какой была бы эта взаимосвязь, если бы остальные переменные (размер читательской аудитории и процент читателей-мужчин) не фиксировались на постоянном уровне? На этот вопрос можно ответить, проанализировав обычный коэффициент корреляции (или коэффициент регрессии, прогнозирующий Y на основании только одной этой Х- переменной), вычисленный только для двух переменных: тарифа и медианы дохода. В нашем случае более высокое значение медианы дохода фактически ассоциируется с более низким тарифом (корреляция тарифа и медианы дохода является отрицательной: -0,167)! Чем это объяснить? Вполне приемлемое объяснение заключается в том, что журналы, ориентирующиеся на читателей с более высоким средним уровнем доходов, не в состоянии обеспечить себе массовую аудиторию из-за того, что богатых людей среди населения страны в целом не так уж много. Если же эта читательская аудитория богатых людей окажется очень небольшой, это может вообще исказить эффект влияния высокого уровня доходов в расчете на одного читателя.

Прогнозы

Уравнение прогнозирования, или уравнение регрессии, определяется в следующем виде:

прогнозируемое значение Y = а + b1X1 + b2X2 + ... + bkXk ,

В нашем примере с рекламными объявлениями в журналах, чтобы найти прогнозируемую величину тарифа на размещение рекламных объявлений исходя из величины читательской аудитории, процента читателей-мужчин и медианы дохода читателей для конкретного журнала, подобного тем, которые составляют рассматриваемую нами выборку данных, подставим в уравнение прогнозирования соответствующие этому журналу значения Х- переменных:

(прогнозируемый тариф на размещение рекламы) = а + b1X1 + b2X2 + b3X3 =

= $4043 + 3,79(читательская аудитория) – 124(процент мужчин) + 0,903(медиана дохода).

Допустим, например, что вы собираетесь основать новый журнал, «Популярная статистика», который рассчитан на читательскую аудиторию порядка 900000 человек, 55% которых будут составлять женщины, а медиана дохода его читателей равна $50000. Данные в уравнение прогнозирования необходимо подставить в той же форме, что и в исходной совокупности данных (т.е. той, исходя из которой и строилось уравнение регрессии): X1 = 900 (читательская аудитория в тысячах человек), X2 = 45 (процент мужчин) и X3 = $50000 (медиана дохода). Прогнозируемое значение для этой ситуации определяется следующим образом:

прогнозируемый тариф на размещение рекламы в журнале «Популярная статистика» =

= 4043 +3,79(читательская аудитория) –124(процент мужчин) +0,903(медиана дохода) =

= 4043 + 3,79 900 – 124 45 + 0,903 50000 = $47024.

Разумеется, рассчитывать на то, что тариф на размещение рекламы в журнале составит ровно $47024, не приходится. Во-первых, даже между журналами, данными о которых мы располагаем, наблюдаются случайные колебания, поэтому прогнозы не являются идеальными даже для них. Во-вторых, прогнозы могут быть полезны лишь в той мере, в какой прогнозируемый журнал подобен журналам, принадлежащим к исходной совокупности данных. Если речь идет о новом журнале, то тариф на размещение рекламы в этом журнале может определяться не так, как для журналов с уже устоявшейся репутацией, которые мы использовали для построения уравнения регрессии.

С помощью этого уравнения можно также прогнозировать тарифы для журналов, принадлежащих к исходной совокупности данных. У первого журнала, «Audubon» X1 = 1645 (читательская аудитория равна примерно 1,6 миллиона человек), X2 = 51,1 (т.е. 51,1% читателей этого журнала — мужчины) и X3 = 38787 (медиана годового дохода читателей этого журнала составляет $38787). Прогнозируемое значение для этого журнала можно найти по следующей формуле:

прогнозируемый тариф на размещение рекламы в журнале «Audubon» =

=  4043 +3,79(читательская аудитория) –124(процент мужчин) +0,903(медиана дохода) =

= 4043 + 3,79 1 645 – 124 51,1 + 0,903 38787 = $38966.

Остаток,   или   ошибка   прогнозирования,   определяется   по   формуле:   Y  (прогнозируемое значение Y).

Для журнала, принадлежащего к исходной совокупности данных, этот показатель равняется фактическому тарифу минус прогнозируемый   тариф.   Для   журнала  «Audubon»   фактический   тариф   составляет $25315, а прогнозируемый тариф – $38966. Таким образом, ошибка прогнозирования равна 25315 – 38966 = –$13651. Отрицательный остаток указывает на то, что фактический тариф меньше прогнозируемого (в случае журнала Audubon примерно на $14000). Для многих из нас $14000 – огромные деньги; неплохо бы взглянуть на другие ошибки прогнозирования, чтобы понять, в какой мере прогнозирование отражает реальную ситуацию. Почему рекламные тарифы в журнале Audubon оказались намного меньше их ожидаемой величины? Скорее всего, потому, что для прогнозирования использовалось лишь k = 3 из множества возможных факторов, влияющих на величину рекламных тарифов (к тому же многие из этих факторов не очень понятны и их довольно сложно измерить).

Насколько хороши наши прогнозы?

Этот раздел следует рассматривать в основном как обзор, поскольку стандартное отклонение оценки, Se , и коэффициент детерминации, R2, имеют для множественной регрессии, вообще говоря, ту же интерпретацию, что и для простой (парной) регрессии. Единственное отличие заключается в том, что ваши прогнозы теперь базируются на нескольких X- переменных. Но все остается очень похоже, поскольку вы по-прежнему прогнозируете только одну переменную Y. 


 

А также другие работы, которые могут Вас заинтересовать

10212. Расчет индукционного нагревателя 77.5 KB
  Расчет индукционного нагревателя. Краткая теория. Описание Индуктором называют катушку индуктивности в которой производят нагрев вихревыми токами электропроводящих тел. При пропускании переменного тока через индуктор подключенный к выходу индукционной устано
10213. Расчет кабеля 344.5 KB
  Расчет кабеля Краткая теория. Кабель – это один или несколько изолированных проводников заключенных в общую защитную оболочку. Голландское слово кабель переводится на русский язык как канат. Различные кабели в нашей стране их выпускают более 1000 типов используют...
10214. Расчет пластины погруженной в жидкость 197 KB
  Расчет пластины погруженной в жидкость. Краткая теория. Нагрев неограниченной пластины. Дана неограниченная пластина толщина которой равна 2R. В начальный момент времени пластина помещается в среду с постоянной температурой . Между ограничивающими поверх
10215. Расчет стационарного или не стационарного температурного поля бака трансформатора 137 KB
  Расчет стационарного или не стационарного температурного поля бака трансформатора Краткая теория. Система индукционного нагрева представляет собой в общем случае источник питания индуктор нагреваемое тело и окружающую среду. Источник питания будь то генерат
10216. КОНСТИТУЦИОННО-ПРАВОВЫЕ ОСНОВЫ ВЗАИМОДЕЙСТВИЯ УГОЛОВНО-ИСПОЛНИТЕЛЬНОЙ СИСТЕМЫ И ГРАЖДАНСКОГО ОБЩЕТВА 281.5 KB
  Анализ исторического опыта взаимодействия общественных организаций и органов, исполняющих наказание в виде лишения свободы. Разработка теоретических аспектов необходимых для создания эффективной системы взаимодействия. Анализ нормативно-правовой базы регулирующей взаимодействие институтов гражданского общества с подразделениями УИС...