89272

Разработка проекта методики оценки показателей надежности ИРЭ на основе метода бутсреп

Дипломная

Экономическая теория и математическое моделирование

В ходе выполнения дипломной работы был изучен и применен метод бутстреп в ФГУП «Спецмагнит», который является разработчиком и производителем постоянных магнитов для электроники, электротехники и приборостроения. Предприятие выпускает все современные виды постоянных магнитов за исключением ферритов...

Русский

2015-05-11

1.15 MB

1 чел.

107

МИНОБРНАУКИ РОССИИ

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ РАДИОТЕХНИКИ, ЭЛЕКТРОНИКИ И АВТОМАТИКИ

МГТУ МИРЭА

Факультет            Электроники

                                                               Форма обучения           очная           

 Кафедра              ТОРЭ  

“ДОПУЩЕН К ЗАЩИТЕ”

 Зав. кафедрой _______________     

ДИПЛОМНАЯ  РАБОТА

Т е м а :  «Разработка проекта методики оценки показателей надежности ИРЭ на основе метода бутсреп».                                                                           

Исполнитель                                                                                                                          

Группа ___________,   шифр          

Руководитель работы            

Консультант по специальной части       

Консультант по организационно-

экономической части          

                                                                                                                               

 

Рецензент                                                

МОСКВА 2012

РЕФЕРАТ

В ходе выполнения дипломной работы был изучен и применен метод бутстреп в ФГУП «Спецмагнит», который является разработчиком и производителем постоянных магнитов для электроники, электротехники и приборостроения. Предприятие выпускает все современные виды постоянных магнитов за исключением ферритов, а также в интересах и по требованию Заказчика ФГУП «Спецмагнит» осуществляет комплексные решения — расчет, оптимизацию, проектирование, производство, поставку магнитных систем и элементов.

Бутстреп-метод, предложенный в 1977 году Б. Эфроном, является одним из методов рандомизированной обработки данных. Сущность данного метода состоит в том, что по имеющимся наблюдениям за случайной величиной моделируется процесс их получения следующим образом. Предполагается, что имеющиеся N значений образуют генеральную совокупность, из которой извлекаются выборки с возвращением объема N с равными вероятностями (1/N) извлечения каждого значения. Всего извлекается B выборок, по каждой из них строится оценка интересующего параметра исходной случайной величины, а затем полученные оценки усредняются.

Бутстреп пригоден для работы с любыми статистическими задачами, будь то проверки гипотез о законах распределения случайных величин, регрессия, дисперсионный анализ или многомерная классификация данных.

Дипломная работа состоит из:

4 раздела и содержит 108 страницы,  5 рисунков, 10 таблиц.

Ключевые слова: бутстреп, методы размножения выборок, точечная оценка, доверительный интервал, закон больших чисел, тестирование гипотез.  

Термины, определения и сокращения

Статистика - измеримая функция результатов наблюдений, включенных в выборку, используемая для получения статистических выводов.

Выборка - совокупность значений одного и того же признака у подвергнутых наблюдению объектов.

Эмпирическое распределение - распределение случайного элемента, в котором каждому результату наблюдения, включенному в выборку, соответствует одна и та же вероятность, равная обратной величине объема выборки. Если в выборку включены результаты наблюдений x1, x2,...., xn, то эмпирическое распределение - это распределение случайной величины Х такой, что Р(Х= xi) = 1/n, i = 1,2,..., n. Если несколько результатов наблюдений совпадают: x1 = x2 =.... = xk = a, то полагают Р(Х=а) = k/n.

Математическое ожидание — мера среднего значения случайной величины.

Дисперсия — мера разброса данной случайной величины, то есть её отклонения от математического ожидания.

Стандартное отклонение — показатель рассеивания значений случайной величины относительно её математического ожидания.

Оценка - результат оценивания по конкретной выборке. Оценка является статистикой, а потому случайным элементом, в частных случаях - случайной величиной или случайным вектором.

Рандомизация - случайный отбор, используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку.

Квантиль - число такое, что заданная случайная величина превышает его лишь с фиксированной вероятностью.

Доверительный интервал - это интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он содержит данный параметр с заданной вероятностью.

МНК – метод наименьших квадратов.

ТПЭ – теория планирования эксперимента. Комплекс мероприятий, направленных на эффективную постановку опытов.

Ресамплинг – метод размножения выборки.


Содержание

Введение………………………………………………………………...6

  1.  Обзор методов размножения выборок………………….. 9
  2.  Концепция максимального правдоподобия………………...…… 9
  3.  Рандомизация…………………………………………………..….  10
  4.  Понятие повторных опытов…………………………………..….. 14
  5.  Планирование эксперимента………………………………...…… 15
  6.  Бутстреп и применение ЭВМ………………………………..…... 26
  7.  Метод «Складного ножа»…………………………………..……. 29
  8.  Принцип метода бутстреп…………………………………..……. 35
  9.  Математические основы метода………………………… 38
  10.  Основные понятия и способы вычисления оценок………..…… 41
  11.  Асимптотическая оптимальность бутстреп-оценок………..…... 46
  12.  Бутстреп-методы доверительного оценивания……………..…... 50
  13.  Построение доверительных интервалов……………………..….. 54
  14.  Доверительные интервалы, основанные на модифицированном бутстрепе…………………………………………………………… 56
  15.  Тестирование гипотез с помощью бутстрепа………………..….. 58
  16.  Асимптотическое рафинирование……………………………….. 60
  17.  Скорость сходимости для зависимого бутстрепа среднего…..... 63

3. Применение метода бутстреп……………………………….. 77

4. Организационно-экономическая часть……………….. 85

4.1. Cоставление сметы затрат на выполнение работы и расчет трудозатрат ……………………………...………………………...86

4.2. Разработка бизнес-плана и составление календарного графика выполнения проекта ………....…………………………………...94

4.3. Технико-экономическое обоснование целесообразности
выполнения работ …………………….....………………………...98

Заключение……………………………………………………….…… 99

Список использованной литературы…………………….… 101

ПРИЛОЖЕНИЯ……………………………………………………………104


 

Введение

Прикладная статистика бурно развивается в последние десятилетия. Серьезным стимулом является стремительно растущая производительность вычислительных средств. Поэтому понятен острый интерес к статистическим методам, интенсивно использующим компьютеры.

Как известно, целью статистических методов служит представление полученных данных в компактном, удобном и наглядном виде (свертка), обобщение их с помощью математических моделей и выработка решений об оптимальных дальнейших действиях.

Бутстреп отличается от традиционных методов тем, что он предполагает многократную обработку различных частей одних и тех же данных, как бы поворот их «разными гранями», и сопоставление полученных таким образом результатов.

Подход был предложен Эфроном в 1977 г. Он прочитал об этом лекцию в риецовских чтениях (в память Генри Льюиса Риеца (Н. L. Rietz, 1875—1943), профессора Иллинойского университета, в 1935—1937 гг. президента американского института математической статистики), которая была опубликована в 1979 г.  [1]

Сам термин «бутстреп»  (bootstrap) буквально означает «вытягивание себя за шнурки от ботинок», метод бутстреп – дальнейшее развитие «метода складного ножа». Идея,  которую  предложил  в  1949  году  М.  Кенуй  («метод складного  ножа»)  состоит  в  том,  чтобы  из  одной  выборки  сделать  много,  исключая  по  одному  наблюдению (и  возвращая ранее  исключенные).  Б.  Эфрон  разработал  новый  способ  размножения  выборок,  существенно  использующий  датчики  псевдослучайных  чисел.  Он  предложил  строить  новые  выборки, моделируя выборки из эмпирического распределения. 

Актуальность темы

Есть  много  способов  развития  идеи  размножения  выборок.  Можно  по  исходной  выборке  построить  эмпирическую функцию  распределения,  а  затем каким-либо образом от кусочно-постоянной  функции  перейти  к  непрерывной  функции  распределения. Другой  вариант – перейти к непрерывному распределению, построив непараметрическую оценку плотности. После этого  рекомендуется  брать  размноженные  выборки  из  этого непрерывного распределения (являющегося состоятельной оценкой  исходного),  непрерывность  защитит от  совпадений  элементов  в  этих  выборках.  Следующий  вариант  построения  размноженных  выборок  –  более  прямой.  Исходные  данные  не  могут быть  определены  совершенно  точно  и  однозначно.  Поэтому предлагается к исходным данным добавлять малые независимые одинаково  распределенные  погрешности.  При  таком  подходе одновременно соединяем вместе идеи устойчивости и бутстрепа [1].  

В новых научно-практических областях со сложными алгоритмами,  свойства  которых  недостаточно  ясны,  бутстреп  представляет собой ценный инструмент для изучения ситуации.  

Не  всегда  статистические  методы  используются  в  чистом виде. Часто их включают в виде важных элементов в комплексные  методики,  предусматривающие  сочетание  статистических методов с другими, например, экспертными оценками [4], [9].

Цель работы

Разработка методологии бутстреп для повышения точности и достоверности оценки показателей надежности изделий радиоэлектроники.

Задачи

Поставленная цель предполагает следующие задачи:

1. Сравнительный анализ эффективности применения известных методов размножения выборок для повышения точности и достоверности оценки показателей надежности изделий радиоэлектроники.

2. Разработка математического аппарата метода бутстреп для точности и достоверности оценки показателей надежности изделий радиоэлектроники.

3. Применение полученных результатов в теории и практике статистического регулирования технологических процессов, создание соответствующего программного обеспечения, предназначенного для практического использования.

Практическая значимость работы состоит в том, что предложенный метод доведен  до уровня, обеспечивающего возможность его практического применения. Данный метод позволит с наименьшими затратами средств выявлять нарушения в технологическом процессе. При этом повышается точность контроля, соответственно уменьшается доля бракованной продукции, снижается риск необоснованных регулировок технологического процесса.


1. Обзор методов размножения выборок

Появление новых подходов всегда вызывает желание выяснить источники и составные части возникшей концепции, структуру и свойства процедур, области применения, возможные трудности и ожидаемое дальнейшее развитие.  Выполнять такую программу в полном объеме сейчас вряд ли осуществимо, но попытаемся все-таки сформулировать некоторые основные утверждения. [1]

1.1. Концепция максимального правдоподобия

Прежде всего приходится констатировать, что подход Б. Эфрона возник под сильным влиянием идей Р. Фишера — в основном концепции максимального правдоподобия, появившейся в 1912 г. Из нее, собственно, следует, что то, что наблюдалось в эксперименте, как раз и "должно было произойти. Поэтому все неизвестные, которые нам надлежит извлечь из эксперимента, надо находить таким образом, чтобы они как можно лучше согласовывались с имеющимися данными. Тогда оценки неизвестных и будут «наиболее правдоподобными» в свете имеющихся данных. Многолетнее интенсивное развитие этой концепции превратило ее в один из краеугольных камней современной математической статистики.

Но есть три обстоятельства, мешающие нам в полной мере осознать преимущества подхода, основанного на принципе максимального правдоподобия. Это — возможное смещение на конечных выборках (а с другими мы, к сожалению, не имеем дела), потребность в существенной априорной информации (знании вида закона распределения исследуемых случайных величин) и вычислительные трудности. Впрочем, последние не имеют принципиального характера, зато с первыми двумя приходится считаться. Бутстреп-метод первоначально возник как средство преодоления выборочного смещения или, во всяком случае, как средство его существенного уменьшения. Если выяснится, что он корректен, то из этого будет следовать, что классическая процедура метода максимума правдоподобия не позволяет извлечь из выборки всю имеющуюся в ней информацию. [1], [6].

1.2. Рандомизация

Обратимся к принципу рандомизации, предложенному Р. Фишером. Часто вместо рандомизации употребляют термин «перестановочный тест» (permutation), имея в виду перестановку данных между отдельными группами. Этот термин не вполне удачен, поскольку в действительности осуществляются не перестановки, а берутся различные комбинации данных, уникальных относительно выбранной тестовой статистики. Рандомизация — искусственное внесение случайности в эксперимент для превращения некоторых систематических ошибок в случайные. Она оказала огромное влияние и на теоретические, и на прикладные исследования во многих областях статистики, особенно в планировании эксперимента.

Этот метод позволяет эффективно уменьшать систематическую погрешность (методическую и инструментальную) путем измерения некоторой физической величины рядом однотипных приборов с последующей оценкой результата измерений в виде математического ожидания (среднего арифметического значения) выполненного ряда наблюдений. В данном методе при обработке результатов измерений используются случайные изменения погрешности от прибора к прибору. Уменьшение систематической погрешности достигается и при изменении случайным образом методики и условий проведения измерений.

Метод рандомизации используется при моделировании, когда:

а) случайные свойства, связанные с надежностью, эффективностью, наступлением события, временем функционирования или ошибками измерений в системе или среде, влияют на результаты моделирования;

б) необходимо получить скорее частные, чем обобщенные, результаты;

в) необходимо определить законы распределения результатов и наряду со средними значениями вычислить дисперсии.

Вот как характеризуют эту идею Р. Фишера М. Кендалл и А. Стьюарт: «... Возможно, не будет преувеличением сказать, что его (Р. Фишера) пропаганда рандомизации при планировании экспериментов была самым важным и имеющим самое большое влияние результатом из его многочисленных достижений в статистике» [5].

Для практического осуществления рандомизации нужен какой-то механизм. В этой роли обычно выступают таблицы или генераторы случайных чисел. Качество получаемых случайных чисел имеет большое значение во всех областях их использования, в том числе и в бутстрепе.

Частным случаем рандомизации является рандомизационный тест. Основная его цель состоит в том, чтобы проверить некоторую нулевую гипотезу. Рассмотрим схему реализации рандомизационного теста для сравнения двух независимых выборок:

1. Выберем метрику T, позволяющую оценить статистическую значимость возможного фактора различий двух групп данных. В качестве таковой удобнее использовать разность между выборочными средними.

2. Вычислим значение статистики для исходных данных tисх

3. Повторяем N раз следующие действия:

  1.  Случайным образом перемешиваем данные обеих выборок.
  2.  Первые n1 наблюдений отбираем в первую группу, остальные n2 – во вторую.
  3.  Вычисляем значение статистики tрнд для рандомизационных данных.
  4.  Если tрнд> tисх увеличиваем на 1 счетчик S

4. Разделив значение S на N, получим соотношение частот, с которой метрика tрнд на рандомизированных данных превысила значение tисх на данных, которые мы получили в эксперименте. Иными словами, вычислим оценку вероятности р того, что случайная величина Т примет значение, большее, чем tисх. По традиции, если р > 0,05, то

принимается нулевая гипотеза H0 об отсутствии значимых отличий исходных выборок от их нуль-модели по индексу Т, а если р меньше задаваемого уровня значимости, то H0 отклоняется в пользу альтернативы.

Разберем конкретный пример. Пусть показатели наработки на отказ группы из трёх ИРЭ составили, соответственно, 85, 105 и 115 тысяч часов. Тогда как этот показатель группы контроля из четырёх ИРЭ, у которых была произведена замена интегральных микросхем импортными аналогами – 110, 125, 125 и 130 тысяч часов. Если замена не влияет на показатель надежности и нулевая гипотеза об отсутствии различий между группами верна, то любые 3 из имеющихся 7 наблюдений с одинаковой вероятностью могли бы быть приписаны к контрольной совокупности, а остальные – к группе с воздействием (т.е. наблюдалось бы явление «exchangeable» или «обмениваемости» данных). Выпишем все 35 возможных вариантов разбиений 7 измерений на 2 группы (таблица 1.2.1). Проанализировав результаты, мы легко найдем, что есть только одна псевдо-комбинация данных, при которой среднее значение для контрольной группы было бы еще меньше (а для группы с воздействием, соответственно, еще больше), чем это получено в эксперименте. Таким образом, различие между группами, столь же большое как это зафиксировано эмпирически, произошло бы только в 2 случаях из 35, т.е. вероятность справедливости сформулированной нулевой

гипотезы составляет 0.0571.


1 группа

Групповое среднее

2 группа

Групповое среднее

85

105

115

101,67

110

125

125

130

122,5

85

105

110

100,00

115

125

125

130

123,75

85

105

125

105,00

115

110

125

130

120

85

105

125

105,00

115

110

125

130

120

85

105

130

106,67

115

110

125

125

118,75

85

115

110

103,33

105

125

125

130

121,25

85

115

125

108,33

105

110

125

130

117,5

85

115

125

108,33

105

110

125

130

117,5

85

115

130

110,00

105

110

125

125

116,25

85

110

125

106,67

105

115

125

130

118,75

85

110

125

106,67

105

115

125

130

118,75

85

110

130

108,33

105

115

125

125

117,5

85

125

125

111,67

105

115

110

130

115

85

125

130

113,33

105

115

110

125

113,75

85

125

130

113,33

105

115

110

125

113,75

105

115

110

110,00

85

125

125

130

116,25

105

115

125

115,00

85

110

125

130

112,5

105

115

125

115,00

85

110

125

130

112,5

105

115

130

116,67

85

110

125

125

111,25

105

110

125

113,33

85

115

125

130

113,75

105

110

125

113,33

85

115

125

130

113,75

105

110

130

115,00

85

115

125

125

112,5

105

125

125

118,33

85

115

110

130

110

105

125

130

120,00

85

115

110

125

108,75

105

125

130

120,00

85

115

110

125

108,75

115

110

125

116,67

85

105

125

130

111,25

115

110

125

116,67

85

105

125

130

111,25

115

110

130

118,33

85

105

125

125

110

115

125

125

121,67

85

105

110

130

107,5

115

125

130

123,33

85

105

110

125

106,25

115

125

130

123,33

85

105

110

125

106,25

110

125

125

120,00

85

105

115

130

108,75

110

125

130

121,67

85

105

115

125

107,5

110

125

130

121,67

85

105

115

125

107,5

125

125

130

126,67

85

105

115

110

103,75

Таблица 1.2.1

  1.  

1.3. Понятие повторных опытов

Обратимся теперь к планированию экспериментов. Кроме понятий смещения и рандомизации, нам понадобится теперь понятие повторных (параллельных) опытов. Представьте себе опытное поле квадратной формы. Вам предстоит выяснить влияние на урожай глубины вспашки и количества внесенных удобрений. Чтобы получить делянки для разной вспашки, разделим квадрат пополам горизонтальной чертой. Верхнюю часть поля будем вспахивать на одну глубину, а нижнюю — на другую. Сравним урожаи с этих двух делянок: где урожай больше, там и глубина вспашки оказалась более подходящей. Теперь, чтобы учесть влияние удобрений, разделим опытное поле снова пополам, но на этот раз по вертикали. На правую половину внесем большое количество удобрений, а на левую — малое. Мы получили 4 делянки, каждая из которых характеризуется своим сочетанием условий обработки почвы под урожай. А логика сравнений остается прежней. Не ясно только, как выбрать масштаб для сравнения урожаев.

Конечно, идея о многократном повторении опытов в одинаковых, насколько возможно, условиях появилась задолго до Р. Фишера. Она была одним из основных принципов научного исследования. Казалось бы, опираясь на этот принцип, надо разделить каждую из получившихся делянок на некоторое число одинаковых повторных делянок и на основании различий в их урожаях оценить ошибку воспроизводимости эксперимента, которая и может служить эталоном, масштабом для сравнения обработок и получения ответов на интересующие нас вопросы о влиянии на урожай глубины вспашки и количества удобрений. Однако такое разделение может привести к смещению оценок из-за особенностей урожайности, рельефа и других свойств опытного поля. Панацеей от такого смещения оказалась рандомизация. Весьма близкое рассуждение провел и Б. Эфрон, перенеся рандомизацию на процедуры обработки данных. И это не единственная связь бутстрепа с идеями планирования эксперимента. [1]

1.4. Планирование эксперимента

Представления о рандомизации и повторных наблюдениях оказали глубокое воздействие не только на теорию планирования эксперимента, но и на теорию выборочного метода с его широчайшей областью приложений. Один ряд работ, начавшийся исследованиями Ю. Неймана (1923 г.), связывает выборочные методы с планированием эксперимента при различных вариантах ограничений на рандомизацию. Другой ряд работ, первые из которых — исследования П. Маха-ланобиса, относится к выборочным обследованиям. В были предложены взаимопроникающие выборки. Этот следующий шаг получается при частичном рандомизированном повторении обследования некоторых единиц. Вот как характеризует этот прием Ф. Йейт: «Дополнительное преимущество взаимопроникающих выборок состоит в том, что они позволяют получить отдельные и независимые оценки значений тех или иных признаков изучаемой совокупности. Согласованность таких оценок для неспециалистов часто более убедительна, чем величина ошибки выборки, в какой бы форме она ни была представлена». Как часто бывает с распространенными методами, взаимопроникающие выборки получили несколько синонимичных названий: подсовокупности, области изучения, дублированный отбор и др.

«Точно так же, как в искусстве политики, в организации статистического исследования всегда имеет место компромисс между желаемым и возможным». После достижения мучительного компромисса в ходе реализации программы обследования или плана эксперимента тоже не все получается так, как задумано. Возникают сбои, пропуски, путаница. Результаты оказываются не совсем теми, на какие мы рассчитывали. Приходится либо разрабатывать специальные, как правило, более сложные, методы обработки данных, либо пытаться «исправить», «откорректировать», «отремонтировать» полученную выборку. Предложение такого рода исходит, видимо, от Д. Гласса. Он корректировал результаты путем взвешивания отдельных групп таким образом, чтобы ошибки в соотношениях компенсировались. Как справедливо отмечается в, «отсутствие данных компенсируется надлежащим образом лишь постольку, поскольку значения изучаемых переменных у пропущенных единиц сходны со значениями их у остальных единиц в соответствующих типических районах». В частности, рассматривается такой вариант: часть единиц из типических районов с наименьшей долей пропусков отбрасывается (случайно), а часть с большей долей пропусков дублируется (тоже случайно). Такие операции родственны бутстрепу. Аналогичный подход предложен и в работе.

С помощью теории планирования эксперимента решаются следующие задачи:

- поиск значений параметров системы, обеспечивающих достижение оптимального значения показателя качества исследуемого объекта при известных ограничениях на значения этих параметров. Перебор всех допустимых сочетаний значений параметров системы с целью поиска оптимального варианта нерационален по затратам ресурсов. Для решения указанной задачи ТПЭ предлагает такую последовательность проведения опытов, которая позволяет применить градиентные методы поиска при априорно неизвестной функции, связывающей показатель качества с параметрами системы;

- приближенное аналитическое описание функциональной связи показателей качества с параметрами системы по результатам проведенного эксперимента. Традиционные методики проведения экспериментов из-за зависимости компонентов восстанавливаемого аналитического описания не позволяют определить раздельное влияние каждого фактора на результирующий показатель, т.е. эти методики обеспечивают получение аналитических зависимостей, пригодных лишь для решения интерполяционных задач. В отличие от них ТПЭ дает возможность оценить вклад каждого параметра в значение показателя, т.е. приближенно восстановить закон функционирования объекта по экспериментальным данным. Полученное аналитическое описание объекта можно использовать для предварительного исследования вариантов построения системы или в интересах построения модели старшей системы, включающей данный объект на правах элемента;

- оценка дифференциального влияния уровней параметров системы на показатель качества. Такая задача возникает в случае, когда параметры системы являются по своей природе качественными или когда количественные параметры могут принимать небольшое число различных значений;

- испытания образцов техники. Планирование должно позволить оценить степень соответствия показателей качества образцов заданным требованиям при минимальном объеме испытаний;

- отсеивающие эксперименты. Предназначены выявить параметры, незначительно влияющие на показатель качества системы;

- адаптивное планирование. Применяется в условиях управления технологическим процессом, когда система управления все время должна приспосабливаться к конкретным условиям функционирования, а возможно, и предсказывать дальнейшее развитие процесса.

Решение задач с применением ТПЭ предусматривает использование априорной информации об изучаемом процессе для выбора общей последовательности управления экспериментами, которая уточняется после очередного этапа проведения исследований на основе вновь полученных сведений. Тем самым достигается возможность рационального управления экспериментами при неполном первоначальном знании характеристик исследуемого объекта. Целесообразность применения ТПЭ тем выше, чем сложнее исследуемая система.

В ТПЭ исследуемый объект (реальный объект, модель объекта) рассматривается как "черный ящик", имеющий входы v (управляемые независимые параметры) и выходы y.

Переменные v принято называть факторами. Теория ПЭ изучает только активный тип экспериментов, когда имеется возможность независимо и целенаправленно менять значения факторов v во всем требуемом диапазоне. Факторы в эксперименте бывают качественными и количественными. Качественные факторы можно квантифицировать или приписать им числовые обозначения, тем самым перейти к количественным значениям. В дальнейшем будем считать, что все факторы являются количественными и представлены непрерывными величинами (если другое не оговорено особо). Переменным v можно сопоставить геометрическое понятие факторного пространства – пространства,  координатные оси которого соответствуют значениям факторов. Совокупность конкретных значений всех факторов образует точку в многомерном факторном пространстве. Примерами факторов являются: интенсивность потока запросов к базе данных, скорость передачи данных по каналу, объем запоминающего устройств. Кроме того, на объект воздействуют возмущающие факторы, они являются случайными и не поддаются управлению.

Область планирования задается интервалами возможного изменения факторов vi,min< vi < vi,max  для i =1, 2, …, k, где k – количество факторов. В теории ПЭ часто используют нормализацию факторов, т.е. преобразование натуральных значений факторов в безразмерные (кодированные) величины. Переход к безразмерным значениям xi задается преобразованием

xi = (vi vi0)/vi,

где vi – натуральное значение фактора, vi0 – натуральное значение основного уровня фактора, соответствующее нулю в безразмерной шкале,  vi – интервал варьирования. Совокупность основных уровней всех факторов представляет собой точку в пространстве параметров, называемую центральной точкой плана или центром эксперимента. С геометрической точки зрения нормализация факторов равноценна линейному преобразованию пространства факторов, при котором проводятся две операции: перенос начала координат в точку, соответствующую значениям основных уровней факторов; сжатие – растяжение пространства в направлении координатных осей.

Активный эксперимент включает: систему воздействий, при которых воспроизводится функционирование объекта; регистрацию отклика объекта. План эксперимента задает совокупность данных, определяющих количество, условия и порядок реализации опытов. Опыт составляет элементарную часть эксперимента и предусматривает воспроизведение исследуемого явления в конкретных условиях с последующей регистрацией результата. В условиях случайности в одних и тех же условиях проводятся параллельные (повторные) опыты в интересах получения статистически устойчивых результатов. Опыт u предполагает задание конкретных значений факторам v u = v1u, v2u, …,  vku, а совокупность значений факторов во всех N точках плана эксперимента образует матрицу плана 

v11, v21, …,  vk1

v12, v22, …,  vk2

.     .     .     .     .

              v1N, v2N, …,  vkN .

Строки матрицы соответствуют опытам, столбцы – факторам, элемент матрицы viz задает значение z-го фактора в i-м опыте.

Вектор y называется откликом. В ТПЭ обычно изучается ситуация, в которой вектор отклика y состоит из одного элемента y. При наличии нескольких составляющих вектора y, каждую из них можно исследовать отдельно. Зависимость отклика от факторов носит название функции отклика, а геометрическое представление функции отклика – поверхности  отклика. Функция отклика рассматривается как показатель качества или эффективности объекта. Этот показатель является функцией от параметров – факторов. На практике широкое распространение получили простые функции вида М{y'} = bf(v),, где b=(b0, b1, …, bh) – вектор неизвестных параметров модели размерности h+1, f(v)=(f0(v), f1(v), …, fh(v)) – вектор заданных базисных функций, М{y'} – математическое ожидание функции отклика. Такое представление функции отклика соответствует линейной по параметрам модели регрессионного анализа, т.е. функция отклика есть линейная комбинация базисных функций от факторов.

Вследствие влияния на результаты экспериментов случайных воздействий истинные значения коэффициентов можно определить только приближенно. Оценку = (0, 1, …, h) вектора неизвестных параметров b находят по результатам экспериментов, в ходе которых получают значения yu при заданных значениях факторов vu. Эти оценки обычно рассчитываются с помощью метода наименьших квадратов (МНК) на основе выборок значений факторов и откликов системы на воздействия. В качестве оценки вектора b выбирается такое значение, которое минимизирует

,

где y'u – вычисленное на модели значение функции отклика в u-й точке факторного пространства. Приравнивая нулю частные производные от данной квадратичной формы, взятые по переменным b0, b1, …, bh, можно получить систему уравнений вида

,

где i= 0, 1, 2, …, h. Значение b находят путем решения этой системы уравнений. Решение системы возможно при линейной независимости базисных функций.

Если не принимать специальных мер, то оценки коэффициентов станут взаимозависимыми, и полученное выражение для функции отклика можно рассматривать только как интерполяционную формулу, что затрудняет ее физическую интерпретацию и последующие расчеты. Однако, формируя специальным образом матрицу плана, можно получить независимые значения . И эти величины будут характеризовать вклад каждого фактора в значение функции отклика.

Итак, задача заключается в определении общей формы записи функции отклика y'. В большинстве случаев вид этой функции, получаемый из теоретических соображений, является сложным для практического применения, а при неполном знании объекта вообще неизвестен. По данным причинам функцию целесообразно представить в универсальном, удобном для практического применения виде, чему соответствует представление в виде полинома. Тогда системой базисных функций является совокупность степенных функций с целыми неотрицательными значениями показателей степени. Полиномиальная форма представления функции отклика примет вид

y' = 0 + 1x1 + …+ kxk + 12x1x2 + 13x1x3+…

+k–1,k xk–1xk + +11x21 + …+kkx2k + … + ,

где– случайная  величина, характеризующая ошибку опыта.

Такая функция отклика линейна относительно неизвестных коэффициентов и будет полностью определена, если заданы степень полинома и коэффициенты. Степень полинома обычно задается исследователем априорно и уточняется в ходе исследования. На практике наибольшее распространение получили полиномы первого и второго порядка, соответственно линейные и квадратичные модели. Коэффициенты полинома принято называть эффектами факторов.

Иногда функцию отклика целесообразно представить в другом виде, например, в виде степенной функции, так как достижение заданной точности требует применения полинома высокого порядка. Однако использование функций, нелинейных относительно неизвестных параметров, усложняет вычисления, затрудняет оценку их свойств. В некоторых случаях задачу можно упростить путем искусственного преобразования нелинейной функции в линейную. При этом требуется соответствующее преобразование и результатов экспериментов.

Применение ТПЭ основано на ряде допущений, а именно:

1. функция отклика содержит в своем составе неслучайную и случайную составляющую. Многие показатели качества автоматизированных систем обработки информации носят случайный характер. Это требует многократного повторения опытов в одних и тех же условиях в целях получения статистически устойчивых результатов, а получаемые оценки показателей должны обладать свойствами состоятельности, эффективности, несмещенности и достаточности. Оценки типовых показателей формируются путем усреднения результатов наблюдений. Поэтому при достаточно большом количестве наблюдений можно считать, что случайная составляющая e распределена по нормальному закону с нулевым математическим ожиданием, что позволяет получить несмещенную оценку математического ожидания функции отклика в конкретной точке плана. Будем также считать, что величина имеет дисперсию, не зависящую от значений факторов. Иначе говоря, результаты, полученные путем усреднения повторных опытов в каждой точке плана, представляют собой независимые, нормально распределенные случайные величины;

2. факторы v1, v2, …,  vk измеряются с пренебрежимо малой ошибкой по сравнению с ошибкой в определении величины y (учет помех в задании факторов приводит к трудно разрешимым проблемам в оценке коэффициентов функции отклика). Ошибка в определении значения функции отклика объясняется не столько погрешностью измерений, сколько влиянием на результат работы системы неучтенных или случайных факторов, например различиями в формируемой последовательности случайных чисел при статистическом моделировании;

3. дисперсии среднего значения функции отклика  в различных точках равны друг другу (выборочные оценки дисперсии однородны). Это означает, что при многократных повторных наблюдениях над величиной yu при некотором наборе значений v1u, v2u, …,  vku, получаемая оценка дисперсии среднего значения не будет отличаться от оценки дисперсии, полученной при многократных наблюдениях для любого другого набора значений независимых переменных v1s, v2s, …,  vks.

Указанные допущения позволяют использовать для расчетов коэффициентов полинома МНК, который дает эффективные и несмещенные оценки коэффициентов и обеспечивает простоту проведения самих расчетов. Применение МНК, вообще говоря, не требует соблюдения нормального распределения результатов наблюдения. Этот метод в любом случае дает решение, минимизирующее сумму квадратов отклонений результатов наблюдения от значений функции отклика. Допущение  о нормальном распределении используется при проведении различного рода проверок, например, при проверке адекватности функции отклика и экспериментальных данных. Естественно, что точность оценок коэффициентов функции отклика повышается с увеличением числа опытов, по которым вычисляются коэффициенты.

В ходе эксперимента возможно смещение. Оно может возникать по трем причинам. Выборочное смещение, обусловившее бутстреп. Другой источник смещения — ошибка измерения, возникающая, как правило, из-за. различий в измерительных приборах или навыках измерителя. Чтобы избежать таких смещений, обычно используют специальные приемы градуировки средств измерения и вычисления поправочных коэффициентов, учитываемых в результатах. Все это традиционно относится к области метрологии. Наконец, последний источник смещения — это смещение, обусловленное моделью, формулой, по которой вычисляется статистика. Если мы считаем, например, что имеет место нормальное распределение, то пользуемся, конечно, соответствующими формулами для вычисления среднего, дисперсии и других интересующих нас величин. И нас не должно удивлять возникновение смещения,  поскольку распределение фактически было совершенно другим. В этом проявляется связь с априорной информацией в методе максимума правдоподобия.

Как бороться с таким смещением? Первая возможность — знать фактическую модель или, по крайней мере, верить, что предлагаемая модель верна. Это стандартный прием параметрической статистики, при котором, по определению, подобные смещения не возникают. Вторая возможность — выбирать такие модели, для которых результаты слабо зависят от действительной ситуации. Это прием непараметрической статистики. Он характерен и для методов робастного оценивани. Причем непараметрическая статистика предполагает поиск способов и формул оценивания, «работоспособных» при любых обстоятельствах (например, при любых распределениях из заданного класса). Робастные же процедуры остаются, в сущности, в рамках параметрического подхода, но с их помощью пытаются противостоять различным засорениям, загрязнениям, выбросам и другим чужеродным примесям в данных. Рассматривая непараметрический подход как средство борьбы со смещениями, можно убедиться, что рандомизация играет в этих процедурах заметную роль. Это прежде всего относится к критерию рандомизации, введенному Р. Фишером. Критерий рандомизации, перестановочные рандомизированные критерии глубоко укоренились в непараметрической статистике. Поскольку они связаны с предметом нашего обсуждения, приведем характерные примеры. Начнем с похожего на ранговый критерия Л. Мозеса и родственных ему процедур. Этот критерий для проверки гипотезы о значимости различия в разбросах двух совокупностей предполагает использование случайных подвыборок. Обращение к рандомизации вызвано стремлением избавиться от обременительного требования равенства медиан. В шаговых процедурах регрессионного анализа возникает трудность с назначением уровня значимости для F-критерия при включении в модель очередного члена и при исключении из нее члена, не оправдавшего надежд. И тут на помощь приходят перестановочные процедуры. При анализе регрессионных остатков применению простых формул препятствует корреляция. В. П. Бородюк и В. Е. Кузнецов предложили добавлять к вектору остатков случайный вектор с нулевым математическим ожиданием и относительно малыми дисперсиями с тем, чтобы за счет небольшого смещения получить независимые наблюдения, к которым приложимы простые формулы. Еще один известный пример — метод случайного баланса в планировании отсеивающих экспериментов, предложенный Ф. Саттерзвайтом в 1959 г.. При этом методе рандомизируют подозреваемые эффекты факторов в надежде минимизировать объем эксперимента.

Рандомизированные процедуры настолько важны для подведения основы под используемые в сложных и неопределенных случаях критерии, что их неоднократно «открывали» вновь. Наиболее яркий пример такого рода — это метод хаотизации. Хаотизация предполагает, скажем,в регреесии рандомизацию вектора откликов при фиксированной матрице плана. Отметим, что такой подход, в отличие от бутстрепа, порождает как бы новую эмпирическую информацию.

До сих пор мы говорили о влиянии на развитие бутстрепа концепции Р. Фишера. Но уже в рамках непараметрической статистики, кроме его работ, решающее воздействие имели исследования А. Н. Колмогорова, Н. В. Смирнова, Ф. Уилкоксона, Дж. Ходжеса и Э. Леманна, а также их многочисленных учеников и последователей. Для бутстрепа непараметрическая статистика— и источник идей, и объект приложения. [1], [8]


1.5. Бутсреп и применение ЭВМ

Еще 30 лет назад из-за большого объема вычислений процедуры типа бутстрепа были немыслимы. Это машинно-ориентированные методы, существенно зависящие от развития вычислительной техники и внешних систем ЭВМ. Конечно, и раньше существовали методы, требующие применения вычислительной техники, например метод Монте-Карло, играющий важную роль и в бутстреп-процедурах. Это направление возникло с появлением работы Н. Метрополиса и С. Улама. Метод Монте-Карло представляет собой рандомизацию условий испытаний при принципиально неполном переборе, причем сами испытания могут быть не только физически экспериментами, но и расчетами на ЭВМ. Родственное направление — случайный. поиск, развивающееся с начала 60-х годов.

Создание концепции имитационного моделирования, связанное с работами Т. Нейлора, обеспечило достаточно прочную основу для применения ЭВМ в статистике и статистики в машинных экспериментах. Одним из важнейших достижений было осознание возможности формулировать задачу имитации как задачу планирования эксперимента. Бутстреп и имитационное моделирование находятся под взаимным влиянием.

Бутстреп-процедура может рассматриваться как способ управления выборкой в ходе обработки данных. Традиционная область управления выборкой — планирование экспериментов или обследований. Новое заключается в переносе идей активного эксперимента на процедуры вычислений, на обработку данных.

При традиционном подходе, если выборка задана, то для получения наиболее эффективных оценок и для проверки гипотез критериями с наибольшей мощностью надо использовать все выборочные наблюдения до одного. Исключение из расчета каждого наблюдения означает уменьшение на единицу числа степеней свободы со всеми вытекающими последствиями. Исследователь в поте лица добывает бесценные крупицы информации, и статистик должен не «расплескать» ни одной из них. Обрабатывали всегда все данные, которыми располагали. Возникновение при таком подходе смещения не было секретом. Адекватность регрессионной модели оценивали по имеющимся данным, уже использованным для вычисления коэффициентов. Настоящее же испытание модели было впереди, когда экспериментатор сможет добыть новые данные. Однако до этого доходило редко: данные добываются действительно не легко и не быстро. Ну а если все-таки нужные данные находились, то это редко приносило радость статистику из-за смещения оценок.

Другое дело, когда данные поступают последовательными сериями (выборками) или единицами. В этом случае применяются и соответствующие методы: текущий регрессионный анализ, стохастическая аппроксимация, рекуррентное оценивание, контрольные карты и т. п. Для применения бутстрепа к последовательным и любым другим экспериментам нет никаких противопоказаний, но в статьях Б. Эфрона, включенных в сборник, упор сделан на случай единственной выборки, быть может, и не слишком большого объема. Это наиболее сложный и принципиальный случай.

До появления имитационного моделирования с его гораздо более легким отношением к эксперименту в статистических работах трудно отыскать даже намеки на управление выборкой в ходе вычислений. Зато существовала другая, хотя и близкая, область исследования — распознавание образов. Первоначальная статистическая постановка задачи распознавания принадлежит Р. Фишеру (это так называемый дискриминантный анализ). Позже был предложен подход, часто называемый «распознаванием с учителем». Теперь его принято называть перепроверкой или кросс-проверкой. Этот простейший прием заключается в том, что исходная выборка случайным образом делится пополам. Одна часть используется для получения интересующих исследователя оценок, а вторая — для «экзамена» (вот почему «распознавание с учителем»).

Легко представить себе дальнейшую эволюцию этой идеи, особенно если под рукой есть хорошая вычислительная техника. Действительно, почему надо делить пополам только один раз, а не несколько (лучше много) раз? Почему надо делить именно пополам? Может быть, для экзамена хватит и одной десятой? [1]

Например, проблеме изучения метода «бутстреп», уделяют внимание не только профессиональные статистики и математики.

Летом 2009 студенты принимали участие в программе Университета Лайолы SCORE (Summer Collaborative Outreach and Research Experience), основанной Луизианским Советом попечителей. Главной задачей SCORE было увеличение количества студентов Луизианы, которые бы стремились к карьерам в области Научно-технической инженерии и математики(Science Technology Engineering and Mathematics (STEM)). В конце концов, SCORE организовала исследовательские группы, состоящие из производственного руководителя, студентов ВУЗов, учеников и учителей средней школы. Планировалось, что опыт в этих группах вдохновит студентов и учеников к научной карьере. Исследовательская группа, включала в себя двух учеников средней школы, двух студентов и производственного участника. Должно быть замечено, что исследовательская команда была малой и программа была запущена летом. Однако, команда не может быть представлена, как возможные участники в течении обычного семестра.

Главной задачей руководителя было определение подходящей исследовательской задачи, которой должна была достичь группа. Задачами были выбраны исследование симуляции Монте Карло с использованием метода Стьюдента и непараметрические доверительные интервалы с использованием бутстрепа для определения подходящего метода. Эта задача была поставлена с тех пор, когда бутстреп как основной вычислительный метод, получил большую долю внимания в статистической литературе, но только недавно начал появлятся в изданиях, которые используются в вузах. На самом деле, даже беглый обзор книг по введению в статистику на www.amazon.com показал, что большинство текстов про статистику вузовского уровня совсем не включают идею бутстрепа. Тексты, которые содержат темы по бутстрепу и техникам повторной выборки, находятся в "дополнительных" главах или в "дополнительных" секциях, которые часто пропускают преподаватели вузов. Методы бутстрепа имеют дополнительную привлекательность в том, что нет необходимости знать массивную математическую составляющую и в том, что данные методы легко программируются. Участники исследовательской команды использовали версии Matlab 2009 для студентов, на которых программировались и запускались симуляции бутстрепа, которые были дополнительной выгодой участия в программе SCORE.

Это симуляционное исследование подчёркивает полезность процедур бутстрепа для оценки неизвестных зависимостей с ассиметричным набором данных. Даже через иследование процедур бутстрепа был сделан шаг вперёд на арене статистических иследований, применение бутстрепа в других академических дисциплинах и в промышленности очень ограничены и методы бутстрепа не так широко известны студентам по статистике. Для стимуляции должного применения этих интенсивных вычислений и очень полезных методов, рекомендуется введение данных методов в курсы статистики для студентов ВУЗов. [25]

1.6. Метод «Cкладного ножа»

Вычислительная техника позволяет осуществить процедуру, связанную с незначительной потерей эффективности, но позволяющую значительно снизить выборочное смещение. Такую процедуру в 1949 г. предложил М. Кенуй. Идея заключалась в том, чтобы последовательно исключать из рассмотрения по одному наблюдению, обрабатывать всю оставшуюся информацию и предсказывать результат в исключенной точке. Совокупность полученных таким образом по всем точкам расхождений несет в себе информацию о смещении, которой можно воспользоваться. Более того, в этих данных есть еще и информация о дисперсии, что открывает перед процедурой новые перспективы. Дж. Тьюки, принимавший активное участие в совершенствовании этого метода, назвал его методом складного ножа. Понятие «складной нож» относится к универсальному методу, призванному заменить частные методики, которые не всегда пригодны, подобно бойскаутскому ножу, годящемуся на все случаи жизни».

Пусть дана выборка . В вероятностно-статистической теории предполагаем, что это - набор независимых одинаково распределенных случайных величин. Пусть эконометрика интересует некоторая статистика  Как изучить ее свойства? Идея, которую предложил в 1949 г. М. Кенуй (это и есть "метод складного ножа") состоит в том, чтобы из одной выборки сделать много, исключая по одному наблюдению (и возвращая ранее исключенные). Перечислим выборки, которые получаются из исходной:

;

;

;

Всего n новых (размноженных) выборок объемом (n-1) каждая. По каждой из них можно рассчитать значение интересующей статистики (с уменьшенным на 1 объемом выборки):

Полученные значения статистики позволяют судить о ее распределении и о характеристиках распределения - о математическом ожидании, медиане, квантилях, разбросе, среднем квадратическом отклонении. Значения статистики, построенные по размноженным подвыборкам, не являются независимыми, при росте объема выборки влияние зависимости может ослабевать и со значениями статистик типа можно обращаться как с независимыми случайными величинами.

Однако и без всякой вероятностно-статистической теории разброс величин дает наглядное представление о том, какую точность может дать рассматриваемая статистическая оценка. Сам М. Кенуй и его последователи использовали размножение выборок в основном для построения оценок с уменьшенным смещением.

Мы тоже не будем отступать от этой традиции. Вернемся к рассмотренной ранее задаче. Пусть показатели наработки на отказ группы ИРЭ составили, соответственно, 85, 105, 115, 110, 125, 125 и 130 тысяч часов.

Но теперь мы хотим оценить выборочную медиану, которая дала бы нам наиболее точное представление об истинном значении параметра наработки на отказ.

  1.  Составим вариационный ряд из исходных данных:

X=85, 105, 110, 115, 125, 125, 130

  1.  Вычислим выборочную медиану, исходя из исходных данных, она, соответственно, равна:

Med(X)=x в случае чётного n (где n – объем выборки)

Med(X) =  в случае нечётного n

Med(X)= 115

  1.  Применяя метод складного ножа, получим «размноженные выборки»:

X*1=105, 110, 115, 125, 125, 130;

X*2=85, 110, 115, 125, 125, 130;

X*3=85, 105, 115, 125, 125, 130;

X*4=85, 105, 110, 125, 125, 130;

X*5=85, 105, 110, 115, 125, 130;

X*6=85, 105, 110, 115, 125, 130;

X*7=85, 105, 110, 115, 125, 125;

 

Выборочные медианы, соответственно:

Med(X1)= 120

Med(X2)= 120

Med(X3)= 120

Med(X4)= 117,5

Med(X5)= 112,5

Med(X6)= 112,5

Med(X7)= 112,5

Усредняя полученные значения:

Medjack(X)=116,43

Оценка по методу складного ножа, хотя и менее точна, но дает меньшее выборочное смещение по сравнению с классическим методом:

σ=15,47

σjack=3,78

В 1959 г. Дж. Дарбин распространил этот метод на конечные выборки. В 1972 г. X. Грей и У. Шукани обобщили его, а в 1974 г. Р. Миллер систематизировал накопленные к тому времени результаты. Более поздним исследованиям посвящены работы.

В русских переводах этот метод называли по-разному: метод Кенуя, поправка на смещение, метод расщепления и т. п..

Специалисты по распознаванию образов независимо от исследований статистиков, приведших к методу складного ножа (правда, позже, чем они), пришли к тем же результатам. Ведь и в распознавании жаль использовать экспериментальные точки слишком расточительно. Одно из первых таких предложений сделал М. Н. Вайнцвайг в 1968 г.. Оно получило название «скользящий контроль». В 1969 г. была доказана несмещенность получаемых таким образом оценок.

Остановимся еще на одном любопытном «ответвлении» в развитии обсуждаемых идей. Это разработанный в конце 60-х годов А. Г. Ивахненко метод группового учета аргументов (МГУА), многочисленные работы о котором публикуются в журнале «Автоматика» (Киев). Этот метод представляет собой соединение идей эволюции (варьирование + селекция), что характерно и для процедур шаговой регрессии, регрессионного анализа, процедур перепроверки. [1], [7]

  1.  

1.7. Принцип метода бутстреп

Бутстреп был предложен как некоторое обобщение процедуры складного ножа. Дело в том, что формирование подвыборок в методе складного ножа, а тем более в методах перепроверки, означает выбор без возвращения из имеющейся совокупности. Б. Эфрон предложил пользоваться выбором с возвращением. Тогда формально сохраняются все степени свободы на каждом этапе обработки данных. Видимо, именно в этом заключается преимущество бутстрепа перед другими планами управления выборкой. Вопрос о корректности такого приема остается, на наш взгляд, открытым. Но если признать его законным, то достоинства бутстрепа, особенно асимптотические, удается доказать вполне строго.

В одной из первых публикаций на русском языке бутстреп-процедура описывалась так. Надо взять эмпирическую выборку, имеющуюся в нашем распоряжении, и протиражировать ее очень большое число раз, допустим миллион. Затем из новой огромной совокупйости случайным образом отобрать очень много выборок объема N, где N объем эмпирической выборки. Для каждой из отобранных таким образом бутстреп-выборок следует провести обработку данных в соответствии с первоначальными целями работы и получить в результате не один ответ, а большое множество их. Наконец, надо как-то распорядиться накопленным «богатством» для уменьшения смещения, для оценивания дисперсии, для построения доверительных интервалов или для проверки гипотез. Заметим, что при осуществлении процедур такого типа удобно пользоваться матричными выборками, известными в планировании эксперимента. Такое представление сразу показывает, что эквивалентное описание бутстреп-процедуры выглядит совсем не так страшно. Действительно, достаточно ввести в рассмотрение некоторую квадратную диагональную матрицу весов, удовлетворяющую двум условиям: целочисленность диагональных элементов и равенство следа числу опытов N. Тогда случайный выбор диагональных элементов матрицы и будет задавать каждую бутстреп-реализацию. Да и программно это реализовать гораздо проще.

Обратимся теперь к необычному названию этого метода. Слово «bootstrap» образовано из двух существительных «boot» и «strap». Каждое из них многозначно. Приведем некоторые их значения. Для первого: ботинок, пинок ногой, колодка (орудие пытки), новобранец (во флоте), контейнер и т. д. Для второго: ремень, ремешок, полоска материи или металла, завязка, липкий пластырь, лямка, скоба, хомут, серьга, кредит, порка ремнем. Соединение этих слов дает значение: кожаная полоска, прикрепляемая петлей к заднику походного ботинка для облегчения его натягивания на ногу. Такие ботинки вошли в моду в Англии в 30-е годы XIX в. Видимо, тогда же появилась и поговорка: «Lift oneself by the bootstrap». Эта поговорка означает: «Выбиться в люди благодаря собственным усилиям», «Самому пробить себе дорогу». Бутстреп-процедур а не требует информации о виде закона распределения изучаемой случайной величины и в этом смысле может рассматриваться как непараметрическая, т. е. она работает без опоры на существенную часть априорной информации, чем, по-видимому, и обусловлен такой выбор термина.

Первое применение термина «бутстреп» относится, по-видимому, к концу 50-х годов. Уже в первых поколениях ЭВМ возникла задача осуществления начальной загрузки — «ввода программы, позволяющей машине осуществить ввод». Это делалось с помощью так называемой нуль-программы. По-русски термин переводился словом «раскрутка». В некоторых операционных системах ЭВМ третьего поколения есть даже команды начальной загрузки BOOT (сокращение от «boot-strap», например в ОС РАФОС для ЭВМ СМ-4 или в близких к ней PDP-11 (операционная система RT-11). Позже значение термина расширилось. Он трактуется так: «Bootstrap — самообеспечивающийся. Относится к методу или устройству, обладающему способностью приводить себя в требуемое состояние с помощью своих собственных действий...». Интересно, что Англо-русский словарь математических терминов (М.: ИЛ, 1962) приводит еще одно значение, связанное с вычислительной техникой: «bootstrap integrator — интегратор с параметрической компенсацией погрешностей». [1]

Рассмотрим задачу с приборами в третий раз для подтверждения эффективности метода «бутстреп». Напомним, наша выборка:

X=85, 105, 115, 110, 125, 125, 130;

Для расчётов используем программу matlab, так как алгоритм метода уже включен в её состав. Так как количество бутстреп-выборок зависит от «прихоти» исследователя, остановимся на n=5000. Синтаксис выглядит следующим образом:

 Xboot = bootstrp(nboot, function, argument)

Применительно к нашему случаю:

 Xboot = bootstrp(5000, @median, X)

Нетрудно сосчитать  среднее значение Xboot, которое составляет:

 Xbootср = 116,11

Выборочное смещение же, при этом, σ=7,63.

  1.  

  1.  Математические основы метода

В чем основная идея группы методов "размножения выборок", наиболее известным представителем которых является бутстреп?

Пусть дана выборка . В вероятностно-статистической теории предполагаем, что это - набор независимых одинаково распределенных случайных величин. Пусть эконометрика интересует некоторая статистика  Как изучить ее свойства? Идея, которую предложил в 1949 г. М. Кенуй (это и есть "метод складного ножа") состоит в том, чтобы из одной выборки сделать много, исключая по одному наблюдению (и возвращая ранее исключенные). Перечислим выборки, которые получаются из исходной:

;

;

;

Всего n новых (размноженных) выборок объемом (n-1) каждая. По каждой из них можно рассчитать значение интересующей статистики (с уменьшенным на 1 объемом выборки):

Полученные значения статистики позволяют судить о ее распределении и о характеристиках распределения - о математическом ожидании, медиане, квантилях, разбросе, среднем квадратическом отклонении. Значения статистики, построенные по размноженным подвыборкам, не являются независимыми, при росте объема выборки влияние зависимости может ослабевать и со значениями статистик типа можно обращаться как с независимыми случайными величинами.

Однако и без всякой вероятностно-статистической теории разброс величин дает наглядное представление о том, какую точность может дать рассматриваемая статистическая оценка. Сам М. Кенуй и его последователи использовали размножение выборок в основном для построения оценок с уменьшенным смещением. А вот Б. Эфрон предложил новый способ размножения выборок, существенно использующий датчики псевдослучайных чисел. А именно, он предложил строить новые выборки, моделируя выборки из эмпирического распределения. Другими словами, Б. Эфрон предложил взять конечную совокупность из n элементов исходной выборки  и с помощью датчика случайных чисел сформировать из нее любое число размноженных выборок. Процедура, хотя и нереальна без ЭВМ, проста с точки зрения программирования. По сравнению с описанной выше процедурой появляются новые недостатки - неизбежные совпадения элементов размноженных выборок и зависимость от качества датчиков псевдослучайных чисел. Однако существует математическая теория, позволяющая (при некоторых предположениях и безграничном росте объема выборки) обосновать процедуры бутстрепа.

Есть много способов развития идеи размножения выборок. Можно по исходной выборке построить эмпирическую функцию распределения, а затем каким-либо образом от кусочно-постоянной функции перейти к непрерывной функции распределения, например, соединив точки отрезками прямых. Другой вариант - перейти к непрерывному распределению, построив непараметрическую оценку плотности. После этого рекомендуется брать размноженные выборки из этого непрерывного распределения (являющегося состоятельной оценкой исходного), непрерывность защитит от совпадений элементов в этих выборках.

Другой вариант построения размноженных выборок - более прямой. Исходные данные не могут быть определены совершенно точно и однозначно. Поэтому предлагается к исходным данным добавлять малые независимые одинаково распределенные погрешности. При таком подходе одновременно соединяем вместе идеи устойчивости и бутстрепа. При внимательном анализе многие идеи эконометрики тесно друг с другом связаны.

В каких случаях целесообразно применять бутстреп, а в каких - другие статистические методы? В период рекламной кампании встречались, в том числе в научно-популярных журналах, утверждения о том, что и для оценивания математического ожидания полезен бутстреп. Однако это не так. При росте числа испытаний методом Монте-Карло бутстреп-оценка приближается к классической оценке - среднему арифметическому результатов наблюдений. Другими словами, бутстреп-оценка отличается от классической только шумом псевдослучайных чисел.

Аналогичной является ситуация и в ряде других случаев. Там, где статистика хорошо развита, где найдены методы анализа данных, в том или иной смысле близкие к оптимальным, бутстрепу делать нечего. А вот в новых областях со сложными алгоритмами, свойства которых недостаточно ясны, он представляет собой ценный инструмент для изучения ситуации. [2]

  1.  Основные понятия и способы вычисления оценок

Пусть дана независимая повторная выборка объема п из неизвестного распределения  F, по которой оценивается значение неизвестного функционала (параметра) (F). Предположим, что для этой цели используется статистика и нас интересует мера  погрешности этой статистики.   На практике используют такие меры погрешности, как смещение

Вп = Вп (F) = EF  - (F),              (2.1.1)

дисперсию

Dn = Dn (F) = EF ( - EF )2,           (2.1.2)

стандартное отклонение

Sn = Sn (F) =,                      (2.1.З)

квадратичный риск

Qn=Qn(F) = EF( -(F))2  (2.1.4)

и некоторые другие. Все эти меры погрешности, как правило, оказываются функционалами от неизвестного точного распределения  статистики  :

G (х) = Gn (F, х) = PF{ }.     (2.1.5)

Символы РF и ЕF здесь и далее указывают на вероятности и математические ожидания, вычисляемые в предположении, что исходная выборка извлечена из распределения F. То, что эта зависимость существенна, можно понять, рассматривая следующий пример. Пусть F X — математическое ожидание действительной случайной величины X, подчиняющейся распределению F; Хп — выборка объема п из  этого распределения,   —   выборочное   среднее.     Тогда ,  

Dn = Qn =n-1DFX

где       DFX =dF(x) — дисперсия    случайной величины X. При больших п в соответствии с центральной предельной теоремой можно использовать   приближенное   равенство

F,(x/[DFX]1/2)   (2.1.6)

где Ф — функция распределения стандартной нормальной случайной величины N (0,1), т. е.

  (2.1.7)

Сущность бутстрепа состоит в следующем: для оценки той или иной меры точности статистики (относительно неизвестного истинного значения ) рассмотрим оценку истинного распределения F по Хп. В параметрическом случае, когда семейство F является конечномерным, т. е. , где Н — открытое подмножество k-мерного евклидова пространства Rk, при выполнении некоторых аналитических предположений (типа условий Крамера — Рао, обеспечивающих хорошие свойства оценок максимального правдоподобия вектора ), оценка — это . В непараметрической ситуации, когда F — почти полностью неизвестное распределение, в роли выступает эмпирическое распределение, приписывающее вес 1/n каждому наблюдению Xi, i = 1,2, ..., п. Выбрав соответствующую типу задачи оценку , рассмотрим условно независимые (при заданных X1, ..., Хп) случайные величины подчиняющиеся распределению , т. е. совместное условное распределение имеет вид

   (2.1.8)

Совокупность называется бутстреп-выборкой объема n. Значение — это бутстреп-реализация или бутстреп-повторение статистики . Условное распределение при заданных X1, ..., Хп, т. е.

 (2.1.9)

называется бутстреп-распределением или бутстреп-оценкой точного распределения   G (•),   определяемого   формулой   (2.1.5).

Бутстреп-оиенки рассмотренных выше мер точности   (или  погрешности)   имеют  вид:

,  (2.1.10)

,              (2.1.11)

,  (2.1.12)

,                 (2.1.13)

где индекс * указывает на (условное) математическое ожидание, вычисленное относительно бутстреп-распределения (2.1.9). В непараметрических ситуациях бутстреп-оденки (2.1.10) — (2.1.13) практически невозможно вычислить для сложной статистики . Дело в том, что для симметрично зависящей от своих аргументов n) статистики  (X1..., Хп) формулы (2.1.10) — (2.1.13) требуют, чтобы статистика вычислилась  раз, что при n=15 составляет 77 558 760. Также во многих параметрических ситуациях «точное» вычисление бутстреп-оценок предполагает использование многих приближенных процедур. Эфрон  предлагает вместо этого использовать синтез идей бутстрепа и метода Монте-Карло. Алгоритм   Эфрона   содержит   следующие    шаги:

1.  По выборке Хп строится оценка распределения F.

2.  Для m=1, 2, ..., М повторить такую процедуру — извлечь выборку  объема n из распределения и вычислить бутстреп-реализацию

.

3.  В качестве оценки  принимается приближение

(x) = {  }/М,              (2.1.14)

где ■ {А} — число элементов (конечного) множества А. Таким образом, приближенные бутстреп-оденки смещения, дисперсии и других характеристик точности статистического вывода можно получить с помощью вытекающих из выражения  (2.1.14) соотношений

, (2.1.15)

,

, (2.1.16)

. (2.1.17)

В действительности важно знать, какое именно количество М бутстреп-реализаций гарантирует необходимую точность приближений Монте-Карло. Также интересно знать, что произойдет, если извлекать бутстреп-выборку объема т, отличного от п. И наконец, нельзя ли улучшить бутстреп-оценки в каком-либо смысле. Для ответа на «наивный» вопрос о том, зачем вообще нужны бутстреп-методы, мы рассматриваем предложенные Эфроном способы построения приближенных доверительных интервалов. Именно здесь теоретическая новизна сочетается с практической полезностью, причем трудно представить более удачный по сравнению с бутстрепом алгоритм построения приближенных доверительных границ, столь хорошо согласующихся с точными, когда последние вообще можно определить.[14]

Прежде, чем говорить об асимптотических свойствах бутстреп-оценок, приведем лишь один пример применения бутстрепа в довольно часто встречающейся регрессионной модели. Пусть мы получили п наблюдений случайной величины Y, которым соответствуют значения  k-мерного вектора аргументов — предикторов. Предположим для простоты, что модель зависимости описывается линейным уравнением

. (2.1.18)

Здесь — независимые, одинаково распределенные остатки, подчиняющиеся неизвестному распределению F, а вектор коэффициентов оценивается по методу наименьших квадратов. Будем считать, что погрешность оценки измеряется матрицей ее ковариаций C = Cov (). Первый способ  оценить  матрицу   С состоит в  том,   что, определив в модели (2.1.18), мы вычисляем оцененные остатки  по формуле

и строим по ним. как по независимым наблюдениям, эмпирическое распределение F. Затем для выборки объема п

из распределения вычисляются значения бутстреп-реализаций   зависимой   переменной: . По  полученным   бутстреп-данным строится оценка наименьших квадратов   так же, как по исходным данным, строилась оценка вектора . Найденные   бутстреп-реализации   вектора   ,   т. е. совокупность можно далее использовать для оценки матрицы С по формуле

, (2.1.19)

.

Другой способ бутстреп-анализа состоит в том, что эмпирическое распределение строится по многомерным исходным данным, при этом на первом шаге появляется (k+1)-мepное эмпирическое распределение , которое приписывает вес 1/n наблюдению , затем извлекается бутстреп-выборка объема п из этого распределения и  по  полученным

векторам строится оценка наименьших квадратов — бутстреп-реализация статистики . Интересующая нас оценка ковариационной матрицы С определяется по величинам  с помощью той же формулы (2.1.19). Б. Эфрон и Р. Тибширани отмечают, что, хотя для конечных выборок результаты и различны, они оказываются эквивалентными    в  асимптотике.[1], [14]

2.2. Асимптотическая оптимальность бутстреп-оценок

Рассмотрим задачу оценивания функции распределения F по выборке объема п из . Для простоты предположим, что функция распределения F и оценка  принадлежат некоторому пространству Z функций на прямой, которое снабжено нормой || • ||. При этом потери от принятия оценки , когда истинная функция распределения есть F, измеряются величиной , где l — монотонная неубывающая функция на множестве неотрицательных чисел. Например, можно измерять потери величиной или . Риском оценки называется среднее значение потерь, т. е. . Чтобы исключить появление так называемых суперэффективных оценок, вводится минимаксный риск , где V — окрестность (неизвестного истинного распределения) в F. Оценка  называется локальной асимптотической минимаксной, если в пределе при ее минимаксный риск по любой достаточной малой окрестности V оказывается меньше, чем у любой другой   оценки,   т.е.

.

Свойство локальной асимптотической минимаксности для оценки будет, как правило, справедливо и для другой оценки отклоняющейся от нее на , т. е. (по вероятности).

Для многих задач оценивания функций (не только функций распределения) нижние границы асимптотического риска оценок описываются неравенством  информации  вида

.

Более наглядная форма последнего утверждения, приближающая его к классическим неравенствам информации, получается, если перейти к пределу по окрестностям V, стягивающимся к (неизвестному истинному достаточно  произвольному) распределению F0:   

.

Здесь — гауссовский процесс с непрерывными траекториями, который имеет нулевое среднее и ковариации, определяемые видом оцениваемой функции и степенью априорной неопределенности распределения наблюдений. Так, в задаче непараметрического оценивания функции распределения при полной неопределенности распределения — это хорошо известный-броуновский мост с ковариационной функцией вида

;      (2.2.1)

здесь  — минимум из t, s. Пусть — бутстреп-версия эмпирического процесса ,

где — эмпирическая функция распределения, построенная   по   бутстреп-выборке объема т из распределения   .

Беран рассмотрел такую ситуацию. Предположим, что по независимой повторной выборке Xn объема п строится статистика  обладающая свойством асимптотической нормальности. Точнее, существует последовательность функционалов , для которой имеет место сходимость по распределению при , т. е.  — оценка зависящего от п функционала . Беран ввел ряд аналитических предположений, которые означают,   что   функция   распределения  случайной величины допускаег асимптотическое разложение первого порядка, (типа разложения Эджворта) равномерно по функции распределения F из малой окрестности произвольного истинного распределения F0. Таким образом, Беран использует негрубую аппроксимацию , а более аккуратное приближение

 (2.2.2)

Здесь коэффициенты k (F),  (F) и b (F) зависят от неизвестного распределения F и удовлетворяют некоторым дополнительным предположениям. Отметим, что — стандартное отклонение статистики . Равномерность подобного разложения означает, что для достаточно малой окрестности V (неизвестного) произвольного распределения F0 остаточный член не просто стремится к нулю при ,   а   удовлетворяет   условию

.

При этих  предположениях  Беран  описывает нижние  границы асимптотического  риска относительно функции потерь вида , где - свертка функции W с некоторой абсолютно непрерывной функцией распределения   V.

Справедливо  неравенство:

. (2.2.3)

В правой части этого неравенства фигурирует гауссовский   процесс

 (2.2.4)

хде — зависящая от неизвестного распределения F неслучайная величина;  — неслучайная функция вида ;      Z — стандартная нормальная случайная величина.

 Оценка    функции распределения   обладает   свойством локальной  асимптотической     минимаксности. В   частности,   этим   условиям   удовлетворяет бутстреп-оценка . При этом для   бутстреп-оценки  имеет место слабая сходимость процесса к гауссовскому процессу , в терминах   которого   описываются   нижние   границы   асимптотического риска.    Используя разложение Эджворта (2.2.2), можно подставить вместо неизвестных  коэффициентов  их  оценки. Получаемая   таким   способом   оценка   функции распределения  отличается   от   бутстреп-оценки  на величину  и обладает   теми же асимптотическими свойствами.     Правда,  на   практике  этот   подход может   привести   к   некоторым   неудобствам, так   как    оценка   с   помощью разложения Эджворта может не быть функцией распределения, т.е. некоторым событиям она будет приписывать отрицательные вероятности, но с ростом объема выборки этот эффект будет все менее и менее заметным.

Беран также объяснил известный в анализе данных парадокс. Казалось бы. если функция распределения  при приближенно   равна (здесь  — функция распределения стандартной нормальной величины), то оценка , где  — оценка величины , фигурирующей в (21), также представляется вполне приемлемой. На самом деле нормированное отклонение при слабо сходится к процессу , где — некоторая неслучайная функция, определяемая истинной функцией распределения . В частности, если распределение  имеет ненулевой коэффициент асимметрии или оценка  смещена, функция отлична от нуля. В таком случае из результатов вытекает, что асимптотический риск оценки  превосходит асимптотический риск бутстреп-оценки.

Результаты Берана проясняют теоретические свойства процедур бутстрепа. Дело в том, что многие процедуры построения приближенных доверительных интервалов существенно опираются на оценки функции распределения  и функционалов от . [12], [14]

2.3. Бутстреп-методы доверительного оценивания

Одно из наиболее интересных применений бутстрепа относится к доверительному оцениванию. Это направление долгое время играло второстепенную роль в теоретических исследованиях. Дело в том, что при точно известном распределении статистики или другой монотонной по функции , когда это распределение не зависит от истинного распределения выборки, несложно построить точный доверительный интервал для . Например, если статистика подчиняется нормальному распределению с известной дисперсией , то центральный доверительный  интервал для имеет вид

,

где -квантиль распределения N (0, 1); . Такой доверительный интервал называют центральным, потому что обе «хвостовые»    вероятности     и  равны . Кажется, что для асимптотически нормальных статистик при

 (2.3.1)

можно строить приближенные доверительные интервалы, пользуясь оценками предельной дисперсии. Это приводит к так называемым стандартным    интервалам    с границами

 (2.3.2)

Эфрон  привел ряд примеров, когда стандартные интервалы неудовлетворительны. Это понятно, ведь они основаны на не самом эффективном выборе оценки функции распределения статистики

, а именно, на оценке вида где оценка предельного стандартного отклонения .

Для устранения недостатков стандартных интервалов Эфрон предложил использовать бутстреп. Он рекомендует, например, строить приближенный доверительный интервал на основе процентилей (или процентных точек) бутстреп-оценки  функции распределения . Это означает, что из исходной выборки извлекается    бутстреп-

выборка по которой определяется бутстреп-реализация статистики . Проводя этот процесс большое число М раз, мы получаем значения , по которым и строится бустреп-оценка функции распределения  вида

.

Квантили  распределения ,  т.  е. решения уравнений ;  и предлагается применять в качестве приближенных границ доверительный интервал  уровня ,  это так называемый процентильный интервал. Если статистика имеет в точности нормальное распределение , то эффективнее оценивать  с помощью , где , — оценки , .

Таким образом, стандартный интервал — это частный случай процентильного интервала. В сущности, подобные способы доверительного оценивания применял еще Фишер при построении доверительных интервалов для корреляции двумерной нормальной выборки. Пусть —эмпирический коэффициент корреляции, , (преобразование Фишера). Тогда распределение статистики    хорошо  аппроксимируется нормальным   распределением , т. е. вероятность почти совпадает с . Поэтому процентильный интервал для можно получить, применив обратное преобразование к стандартному интервалу  для  .

Эфрон дал общее условие применимости процентильного интервала, которое состоит в том, что оценивающая статистика может быть преобразована к нормально распределенной статистике, т. е., если найдутся монотонные преобразования , , так что статистика подчиняется нормальному распределению , то можно использовать процентильный метод. При этом не обязательно знать вид преобразований g, h и значение константы — это не используется при построении процентильного интервала. Процедура процентильного метода инвариантна относительно  монотонных  замен   шкал , , т. е.

.  (2.3.3)

Здесь — доверительная граница процентильного   метода:

.       (2.3.4)

В сложных ситуациях и процентильный метод можно улучшить за счет известной в анализе данных процедуры коррекции смещения. Дело в том, что хорошие свойства процентильного интервала объясняются совпадением медианы бутстреп-распределения статистики и самой величины , т. е. . Когда это не так, процентильный интервал может иметь заметное смещение относительно точного доверительного интервала. Коррекция смещения проводится с помощью величины

.  (2.3.5)

Это приводит к так называемым ВС-интервалам, или процентильным интервалам с коррекцией смещения, границы которых определяются  формулой

.  (2.3.6)

Эфрон предложил дальнейшее   развитие   ВС-метода,   так   называемый ВСα-метод. Константа «ускорения» α (на самом деле α оказывается функционалом от распределения статистики ) выражается формулой

. (2.3.7)

Здесь -так называемая эмпирическая функция влияния, a  — вырожденное распределение вероятностей, сосредоточенное в точке х. Название «эмпирическая функция влияния» вызвано формальным сходством с «теоретической» функцией влияния  [17]. Доверительные границы для по ВСα-методу имеют вид

, (2.3.8)

так что при α=0 получим те же границы, что и   при   ВС-методе.

Эфрон обосновывает бутстреп-методы доверительного оценивания лишь в сравнительно простых ситуациях (когда статистика подчиняется распределению , так что бутстреп-распределение — это ), высказывая надежду, что дальнейшее развитие асимптотической теории позволит обосновать эти методы для широкого класса задач. [14]

2.4. Построение доверительных интервалов

Ответ на вопрос, какие статистики лучше использовать при построении доверительных интервалов с помощью бутстрепа, кроется в двух простых соображениях. Во-первых, бутстреповское распределение центрировано не около истинного значения статистики, а около его выборочного аналога. Во-вторых, полагается бутстрепировать асимптотически пивотальные статистики.

Рассмотрим несколько вариантов бутстраповских статистик, используемых для построения доверительных интервалов и подчеркнем их положительные и отрицательные качества. Пусть нас интересует построение статистических выводов относительно параметра  из ее оценки .

Эфроновский доверительный интервал. В данном случае бутстрепируемой статистикой является сама оценка, т.е. . Таким образом, мы получаем бутстреповское распределение . Соответствующие квантили распределения - , а доверительный интервал –

. (2.4.1)

Эфроновский доверительный интервал был популярен, когда бутстреповский подход только начинал использоваться. На самом деле, этот доверительный интервал дает неплохую аппроксимацию для истинных уровней значимости, поскольку сохраняет смещение исходной выборки.

Холловский доверительный интервал. Холл предложил использовать для построения доверительного интервала рецентрированную статистику , что снимает проблему смещения, связанного с конечностью выборки. Таким образом, получается бутстреповское распределение . Соответствующие квантили - , а доверительный интервал -

. (2.4.2)

Холловский доверительный интервал дает лучшую, чем Эфроновский. аппроксимацию уровней значимости. Плюсом использования Холловского доверительного интервала является отсутствие необходимости оценивания стандартных ошибок.

•   t-процентный доверительный интервал. Такой интервал использует в качестве бутстрепируемой статистики t-статистику, т.е.. Таким образом, находят бутстреповское распределение статистики и соответствующие квантили , а сам t-процентный доверительный интервал строят как

. (2.4.3)

t-процентный доверительный интервал еще лучше аппроксимирует истинные уровни значимости, чем Холловский доверительный интервал. Но использовать его рекомендуется только если стандартные ошибки можно построить качественно.

•   Симметричный t-процентный доверительный интервал. Такой интервал использует в качестве бутстрепируемой "симметризованную t-статистику". Распределение бутстреповской статистики есть , а правый кванитиль -. Симметричный t-процентный доверительный интервал  есть

. (2.4.4)

Симметричный t-процентный доверительный интервал имеет в определенных случаях преимущество перед t-процентным доверительным интервалом. А именно, если асимптотическое распределение статистики симметрично (как раз как в случае асимптотической нормальности), то   дает лучшую аппроксимацию уровней значимости.[1], [2]

2.5. Доверительные интервалы, основанные на модифицированном бутстрепе

Основная идея метода бутстрепа базируется на том факте, что эмпирическое распределение Fп сближается с истинным распределением Fо. Отсюда можно сделать заключение, что распределение оценок , полученных по наблюдениям, имеющих распределение Fп, близко к распределению оценок по наблюдениям с распределением Fо. С другой стороны, доверительные интервалы обладают следующим свойством: концы интервала соответствуют довольно сильно различающимся между собой распределениям. Другими словами, вероятность получить выборку с «сильно различающимися» наблюдениями равна α, т. е. единица минус уровень доверия.

Наша основная идея состоит в построении двух распределений Fn+ и Fn - таких, что вероятность получить наблюдаемую оценку равна α. Мы также потребуем, чтобы эти два распределения были построены по наблюдаемой выборке. Кроме этих ограничений, мы потребуем еще, чтобы эти распределения были близки к эмпирическому распределению. Другими словами, мы хотим изменить функцию эмпирического распределения, но не более, чем это необходимо. Доверительные интервалы будут определяться θ-значениями, соответствующими Fn - и Fn+.

Появление зависимых наблюдений влияет на вероятностные свойства эмпирического распределения. Мы будем измерять это влияние, используя следующее линейное выражение, которое ведет себя как псевдо-значение

(2.5.1)

Если θ определено для выборки размера n-1, то последнее выражение может быть заменено обычным псевдо-значением из теории статистик метода складного ножа.

Распределения Fn - и Fn+ выбираются в виде, где с выбрано так, чтобы вероятности «хвостов» были бы в точности равны α и    1- α (знак означает пропорциональность левой и правой частей, ).

Если θ линейна по zi, то эти  распределения имеют  наибольшую  энтропию  среди всех  распределений с такими же «хвостовыми» вероятностями. Аппроксимация доверительного интервала для θ(F) может теперь быть построена в виде интервала.

Легко осуществить повторную выборку из распределений Fn+ и Fn - тем же самым способом, что и повторный выбор в обычном бутстрепе. Возьмем N независимых бутстреп выборок с простым случайным выбором с возвращением из наблюдаемой выборки. Для каждой бутстреп выборки вычислим соответствующие оценки , i = 1, 2, …, n.

Для фиксированного значения с «хвостовые» вероятности соответствующих распределений могут быть легко оценены выражением

. (2.5.2)

Используя интерполяцию, легко получить значения с, дающие корректные «хвостовые» вероятности для а= (т. е. α и 1- α). Раз определены два значения с, то соответствующие им значения дают бутстреп интервал и . [11]

2.6. Тестирование гипотез с помощью бутстрепа

Одной из основных целей бутстрепа является тестирование гипотез. Рассмотрим, как с помощью бутстрепа тестируются простейшие статистические гипотезы. Пусть нулевая гипотеза имеет вид , где - скаляр.

Альтернативная гипотеза односторонняя: . Бутстрепим t-процентную статистику

(2.6.1)

и получаем бутстреповское распределение этой статистики и соответствующий квантиль:

  (2.6.2)

Гипотеза H0  отвергается, если .

Альтернативная гипотеза двусторонняя: . В этом случае мы бутстрепим симметричную t-процентную статистику

. (2.6.3)

Получаем бутстреповское распределение и квантиль:

. (2.6.4)

Гипотеза H0 отвергается, если  .

Пусть нулевая гипотеза имеет вид , где - вектор. В этом случае мы бутстраиим Вальдовскую статистику (с точностью до коэффициента пропорциональности)

.

Соответственно, получаем бутстреповское распределение и квантиль:

(2.6.5)

Гипотеза H0 отвергается, если .

Пусть теперь нулевая гипотеза имеет вид линейных ограничений на коэффициенты , где R - матрица ограничений. В этом случае мы снова бутстрепим Вальдовскую статистику (с точностью до коэффициента пропорциональности)

.

Получаем бутстреповское распределение, из которого находим соответствующий квантиль:

. (2.6.6)

Заметим, что мы рецентрируем бутстреповскую статистику. Без этого бутстреповское распределение унаследовало бы смещение, свойственное первоначальной статистике. Гипотеза H0 отвергается, если .

2.7. Асимптотическое рафинирование

Иногда говорят, что с помощью бутстрепа достигается асимптотическое рафинирование. В этой главе мы обсудим, что такое асимптотическое рафинирование и в каких случаях оно имеет место.

Пусть у нас есть некоторая статистика . истинное распределение которой . Обозначим бутстреповское распределение этой статистики через . Говорят, что с помощью бутстрепа достигается асимптотическое рафинирование, если ошибка аппроксимации истинного распределения бутстреповским - большего порядка малости, чем ошибка аппроксимации асимптотическим распределением при стремлении объема выборки к бесконечности.

Приведем примеры, использующие разложение Эджворта функции распределения статистики вокруг предельного распределения.

1. асимптотически пивотальиая t-статистика. Пусть бутстрепируемая нами статистика есть

.

Ее асимптотическое распределение, как мы уже видели, является стандартным нормальным: (т.е. статистика асимптотически пивотальная). Обозначим точное распределение статистики через а бутстреповское - через. Для кумулятивной функции стандартного нормального распределения используем обычное обозначение  .

Итак, разложим истинное и бутстраповское распределения вокруг асимптотического:

(2.7.1)

Здесь  - четная по х. непрерывная по F функция, - нечетная по х, непрерывная но F функция. Ошибки аппроксимации точного распределения асимптотическим и бутстреповским, соответственно, равны

 (2.7.2)

Здесь мы воспользовались тем фактом, что разность имеет асимптотику поскольку

.

Таким образом, в данном примере использование бутстрепа приводит к асимптотическому рафинированию.

2. асимптотически непивотальиая статистика. Рассмотрим статистику

Сохранив обозначение кумулятивных функций распределения для точного распределения и бутстреповского из предыдущего пункта, обозначим асимптотическое распределение через . Заметим, что теперь наша статистика асимптотически непивотальна, т.е. ее ассимтотическое распределение зависит от неизвестного параметра, в данном случае . Как в предыдущем примере, разложим точное и бутстреповское распределения вокруг асимптотического:

,

. (2.7.3)

Ошибки аппроксимации для асимптотического и бутстреповского распределений считаются аналогично предыдущему примеру:

,

. (2.7.4)

Как видно, в данном случае использование бутстрепа не приводит к асимптотическому рафинированию. Вообще, как правило, бутстрепирование асимптотически непивотальных статистик не дает асимптотического рафинирования.

3. асимптотически пивотальная симметричная t-статнстнка. Теперь рассмотрим в качестве примера симметричную t-статистику

.

Сохраняя обозначения предыдущих примеров, разложим точное и бутстреповское распределения:

,

. (2.7.5)

Таким образом, ошибки аппроксимации для асимптотики и бутстрепа имеют порядки

,

. (2.7.6)

Таким образом, мы получаем асимптотическое рафинирование. Заметим, что бутстрепирование симметричного двустороннего теста имеет ошибку более высокого порядка, чем бутстрепирование одностороннего теста.

2.8. Скорость сходимости для зависимого бутстрепа среднего

Работы о состоятельности бутстреп-оценок привлекают в последнее время большое внимание как с теоретической, так и с прикладной точки зрения из-за растущей потребности в этой процедуре. Важно отметить, что экспоненциальные неравенства играют большую роль в доказательстве асимптотической значимости бутстрепа среднего.

Начнем с небольшого обсуждения предыдущих результатов, где рассматривается последовательность независимых одинаково распределенных (н.о.р.) случайных величин и классический (независимый) бутстреп среднего. Пусть есть последовательность н.о.р. случайных величин, определенных на вероятностном пространстве . Для и пусть означает эмпирическую меру и пусть — н.о.р. случайные величины с законом распределения , где — последовательность натуральных чисел. Другими словами, случайные величины получены случайным отбором с возвращением из п случайных величин . Для каждого  случайный вектор  называется бутстреп выборкой Эфрона [24] из объема m(n). Пусть — выборочное среднее.

Когда распределение X невырождено и ЕХ2 <, Бикел и Фридман [19] показали, что для почти всех верна следующая центральная предельная теорема:

. (2.8.1)

Здесь и далее = DX. Отметим, что по теореме Гливенко-Кантелли приближается к Y(X) для почти всех с ростом п и по классической центральной предельной теореме Леви

(2.8.2)

Отсюда следует, что для почти всех бутстреп-статистика

близка по распределению к

, (2.8.3)

когда п достаточно велико. В этом заключается основная идея бутстрепа, и мы отсылаем к основополагающей работе Эфрона [24], где эта интересная идея выражена явно и подтверждена серией важных примеров.

Усиленные законы больших чисел для бутстрепа среднего были доказаны Атрейей  и Чёргё. Аренал-Гутиэррес, Матран и Куеста-Албертос  проанализировали результаты , затем, учитывая различные скорости роста объема повторной выборки т(п), они привели новые, более простые доказательства этих результатов. Они также привели примеры, показывающие, что объемы повторных выборок, необходимые для утверждения сходимости почти наверное (п.н.), являются практически оптимальными.

Другая публикация -  это работа Микоша [25]. Он установил ряд полезных экспоненциальных неравенств, которые являются важным инструментом для доказательства состоятельности бутстрепа среднего. Основываясь на этих экспоненциальных неравенствах, Ли, Росальский и Ахмед доказали полную сходимость в духе Баума-Каца, Эрдёша, Сюя-Роббинса и Спитцера для бутстрепа среднего и наличие моментов супремума нормированных бутстреп-сумм. Важно отметить, что не накладываются условия на маргинальные или совместные распределения случайных величин, из которых извлекается бутстреп-перевыборка.

Понятие процедуры зависимого бутстрепа было введено Смитом и Тейлором, где также установлены некоторые важные свойства такого бутстрепа. Основной целью является расширение и обобщение результатов Ли, Росальского и Ахмеда  об усиленном законе больших чисел на случай процедуры зависимого бутстрепа. Основными инструментами являются расширение и обобщение результатов Микоша [25]  и Смита и Тейлора [12].

1. Зависимый бутстреп. Результаты этого пункта представляют собой изменение, обобщение и расширение результатов Смита и Тейлора на случай зависимого бутстрепа из последовательности не обязательно н.о.р. случайных величин. Отметим, что Смит и Тейлор рассматривали только случай н.о.р.

Пусть — последовательность случайных величин (не обязательно независимых и одинаково распределенных), которые определены на вероятностном пространстве . Пусть и — две последовательности таких натуральных чисел, что для всех .

Для и  зависимый бутпстреп определяется как выборка объема т(п), извлеченная без возвращения из набора пk(п) значений, полученных как k(п) копий выборочных наблюдений . Эта процедура зависимого бутстрепа предназначена для уменьшения разброса оценок и, следовательно, для получения лучших доверительных интервалов. В статье [26], где доказан этот факт и приведены результаты моделирования доверительных интервалов с целью изучения возможных выигрышей в вероятности накрытия и длине интервалов.

Приводимое ниже предложение 1 дает совместное распределение случайных величин, полученных из зависимого бутстрепа. Нам потребуются следующие обозначения.

Для ,  и вещественного числа х положим , где — индикаторная функция. Следовательно, случайная величина подсчитывает число наблюдений, меньших или равных x.

Для конечной последовательности вещественных чисел обозначим ее невозрастающую перестановку, т.е. и для любого найдется такое , что .

Предложение 1. Пусть , и  последовательность вещественных чисел.

1)  Если для всех , то

. (2.8.4)

2)  Если  хотя бы для одного , то эта вероятность равна нулю.

Доказательство. Пусть  — такая перестановка чисел 1,... ,m(n) , что для . Тогда

,

если  для всех .

Вторая часть предложения очевидна.

Естественно, случайные величины , полученные зависимым бутстрепом, являются зависимыми. Они обладают так называемым свойством отрицательной зависимости — это будет показано в предложении 2. Понятие отрицательной зависимости было введено Леманом  следующим образом.

Случайные величины  отрицательно зависимы, если для любого выполняются неравенства

,

, (2.8.5)

каковы бы ни были последовательности вещественных чисел.

Предложение 2. Для  и  случайные величины, полученные зависимым бутстрепом , являются отрицательно зависимыми и перестановочными.

Доказательство. Докажем только первое неравенство в определении отрицательной зависимости, ибо второе неравенство доказывается аналогичным образом.

Пусть — последовательность вещественных чисел. Представляет интерес только случай, когда  для всех . В силу предложения 1

 

Свойство перестановочности непосредственно следует из предложения 1.

2. Несколько технических лемм. В этом пункте мы приводим несколько технических результатов, используемых при доказательстве основных результатов статьи. Некоторые из лемм представляют собой расширение и обобщение известных ранее результатов. Для того чтобы статья была самодостаточна, мы намечаем их доказательства.

Для простоты под ln-функцией в этом пункте мы подразумеваем функцию натурального логарифма. Результаты могут быть легко обобщены на другие логарифмические функции с основанием, большим единицы.

Первая лемма хорошо известна и тривиальна. Поэтому мы опускаем доказательство.

Лемма 1. Пусть последовательность отрицательно зависимых случайных величин.

1)  Если последовательность измеримых, монотонно возрастающих (или убывающих) вещественных функций, то есть последовательность отрицательно зависимых случайных величин.

2)  Для всех справедливо неравенство если эти математические ожидание конечны.

К сожалению, функция, обратная к функции , t > 0, , не выписывается в явном виде. Но следующая лемма дает хорошую «аппроксимацию» обратной функции.

Лемма 2.  Пусть  и , t  e, .  Тогда

. (2.8.6)

Доказательство.   Отметим, что

и  

для t  e, что может быть установлено дифференцированием.

Основная идея леммы 2 состоит в том, что для положительной случайной величины Y условия и равносильны.

Лемма 3. Пусть , t > 0, — положительная, строго возрастающая функция, удовлетворяющая условию , когда . Положим , . Пусть, более того,  последовательность одинаково распределенных случайных величин. Если

(2.8.7)

и , где  обратная функция к , то

  п.н. (2.8.8)

В следующей лемме также важно отметить отсутствие условия независимости.

Лемма 4.   Пусть такая последовательность одинаково распределенных случайных величин, что

для некоторого .  Тогда

 п.н.

Доказательство.  Для того чтобы применить лемму 3, положим , , , и (тогда ). Если ,

t  е, то ,и по лемме 2 с  условия и будут эквивалентны. Отметим, что

.

Последнее, что мы должны установить, это соотношение .

Имеем:

.

Так как последовательность строго возрастает, то последняя сумма не превосходит

.

В силу леммы 3

 п.н.

Лемма 4 доказана.

Две следующие леммы имеют дело со сходимостью максимумов случайных величин. Опять-таки, не накладываются условия независимости.

Лемма 5. Пусть последовательность положительных случайных величини такая неубывающая последовательность положительных чисел, что . Тогда условия п.н. и п.н. равносильны.

Доказательство.  Пусть  п.н. Для любого   справедливы следующие неравенства:

.

Так как последовательность    не убывает,  то последнее выражение не превосходит

,

где сперва , а потом . Обратное утверждение очевидно.

Лемма 6. Пусть, t  0, — строго возрастающая функция и такая неубывающая последовательность положительных чисел, что , п 1, где С не зависит от п. Пусть, более того, такая последовательность положительных одинаково распределенных случайных величин, что  при любом .  Тогда

  п.н.

Доказательство.  Для любого

.

По лемме Бореля-Кантелли п.н. Теперь для завершения доказательства достаточно применить утверждение леммы 5.

Следующее экспоненциальное неравенство является основным инструментом, используемым при доказательстве закона больших чисел для зависимого бутстрепа среднего. Оно является аналогом экспоненциального неравенства Микоша  на случай зависимого бутстрепа.

Нам нужно добавить два дополнительных обозначения к обозначениям из п. 2. Пусть  — последовательность (не обязательно независимых или одинаково распределенных) случайных величин. Для и  положим

, (2.8.9)

, (2.8.10)

где

.

Лемма 7. Пусть  u две последовательности положительных чисел. Тогда для и  таких, что , и любых  > 0 выполняется следующее неравенство:

.

.

Доказательство.   По неравенству Маркова

.

Оценим только среднее в первом слагаемом в правой части, точно такая же оценка имеет место и для среднего во втором слагаемом.

Начнем с того, что в силу предложения 2 случайные величины , , полученные процедурой зависимого бутстрепа, являются отрицательно зависимыми и перестановочными. Следовательно, по п. 1) леммы 1 случайные величины

отрицательно зависимы и одинаково распределены.  Поэтому

 

по п. 2) леммы 1. В силу одинаковой распределенности это выражение равно

.

Таким образом,

(2.8.11)

3.  Скорость полной сходимости для зависимого бутстрепа среднего.   С помощью полученных результатов можно вывести закон больших чисел для зависимого бутстрепа среднего.

Теорема. Пусть  последовательность (не обязательно независимых или одинаково распределенных) случайных величин и последовательность положительных чисел. Если

    п.н., (i)

  п.н., (ii)

то для всех вещественных чисел r, любого > 0 и почти всех и

. (2.8.12)

Прежде чем доказывать эту теорему, сделаем ряд замечаний.

Замечания.

1. Результат теоремы будет тем более сильным, чем больше значение r. В противоположность теоремам Баума-Кана, Эрдёша, Сюя-Роббинса и Спитцера о полной сходимости, значение r не играет никакой роли в условиях теоремы и может быть взято произвольно большим.

2.   При r = 0 по лемме Бореля-Кантелли и результату теоремы можно утверждать, что для почти всех

п.н.

3.   В силу леммы 5, если монотонно, то условие (i) теоремы эквивалентно более слабому и значительно более простому условию

п.н.

4.  Тщательный анализ доказательства теоремы показывает, что условия (i) и (ii) могут быть слегка ослаблены:

   п.н., (i')  

  п.н., (ii')

Игнорируя тот факт, что условия (i') и (ii') очевидно слабее, чем условия (i) и (ii), следует заметить, что они более громоздки и их сложнее проверить.

Доказательство теоремы. Утверждение теоремы очевидно для r < -1, так что предположим, что . В обозначениях леммы 7 пусть

.

Легко проверить, что условия (i) и (ii) влекут .

Для фиксированного ,> 0 и положим

, .

Так как , то можно утверждать, что

, .

Пусть n будет настолько большим, что

и .

Из леммы 7 следует, что

,

так как , откуда следует утверждение теоремы.

Следствие.  Пусть  последовательность одинаково распределенных (не обязательно независимых) случайных величин и . Если

,

то для любого r, любого > 0 и почти всехш

. (2.8.13)

Доказательство.   Положим

и , .

Нужно проверить, что выполняются условия (i) и (ii).

Для условия (i) обозначим

и , .

В силу леммы 2 имеем , где величина С не зависит от n. Теперь условие (i) следует из леммы 6.

Условие (ii) непосредственно вытекает из леммы 4. Следует отметить, что утверждение леммы 4 остается справедливым даже при более слабом моментном условии.


3. Применение метода бутстреп

Постановка задачи. Сравним оценку средней интенсивности отказов технической системы классическим методом, бутстрепом и методом складного ножа. Пусть время безотказной работы технической системы подчиняется закону Вейбулла с параметрами S = 0,5; 1; 2. Для моделирования вероятностей безотказной работы воспользуемся генератором псевдослучайных чисел в интервале (0;1). Число экспериментов – 100. Количество наблюдений параметра наработки на отказ – 5; 10; 100. Используемое программное обеспечение – excel, matlab.

Алгоритм решения. Генерируются 100 выборок объема N (где N – количество наблюдений параметра наработки на отказ), состоящих из случайных чисел от 0 до 1. Для этого в среде matlab используем следующую команду:

x=rand(100,N)

Легко рассчитать время наработки на отказ при каждом наблюдении:

t =  где S – параметр формы

Интенсивность отказов:

λ ср.=

Для метода складного ножа в среде matlab используется следующий синтаксис:

j = jackknife(стат. функция, аргумент)

Для метода бутстреп:

b = bootstrp(кол-во бутстреп-выборок, стат. функция, аргумент)

Итоговые результаты представлены в таблице 2.1

S

λ

λjack

λboot

σ

σjack

σboot

N=5

0,5

0,0022131

0,0022131

0,0021583

0,0027803

0,0000279

0,0002753

1

0,0011827

0,0011827

0,0011822

0,0006027

0,0000061

0,0000659

2

0,0010295

0,0010295

0,0010274

0,0002555

0,0000026

0,0000269

N=10

0,5

0,0015549

0,0015549

0,0015460

0,0009692

0,0000098

0,0000254

1

0,0010954

0,0010954

0,0010969

0,0003439

0,0000035

0,0000375

2

0,0010127

0,0010127

0,0010109

0,0001650

0,0000017

0,0000184

N=100

0,5

0,0010424

0,0010424

0,0010438

0,0002440

0,0000025

0,0000254

1

0,0010132

0,0010132

0,0010136

0,0001086

0,0000011

0,0000116

2

0,0010052

0,0010052

0,0010061

0,0000544

0,0000005

0,0000057

Таблица 3.1

Таким образом, оценка складного ножа и бутстрепа практически не отличается от классической оценки. Тем не менее, видно, что стандартное отклонение по методу складного ножа на два порядка меньше классического метода, благодаря чему повышается точность оценки. Тем не менее, из-за необходимости исключения одного наблюдения, метод складного ножа не позволяет сохранить все степени свободы исходной выборки. Бутстреп же лишен этого недостатка [25].


Метод бутстреп был использован в ФГУП «Спецмагнит» для статистического регулирования технологических процессов при производстве четырех видов магнитов на основе магнитотвердых сплавов типа ЮНДКТ. В обозначении марок сплавов буквы обозначают: Ю – алюминий, Н – никель, Д – медь, К – кобальт, Т – титан.

Технические условия на магниты ТУ 6391 – 014 – 07588290 – 2009. Они предназначены для использования в магнитных системах, цепях, элементах приборов, машин и аппаратов общетехнического и специального назначения.

Технологией производства предусмотрен промежуточный контроль параметров, который проводится после термомагнитной обработки магнитов (изотермической магнитной обработки) и перед их окончательной механической обработкой.

В начале производства оборудование (специальные печи и  ванны) настраивают на номинальное значение параметра. В дальнейшем, однако, как показывает опыт, появляются отклонения, обусловленные случайными и систематическими ошибками. К систематическим ошибкам в данном случае можно, например, отнести износ оборудования, неконтролируемый нагрев и деформацию обрабатываемой детали, неоднородность в сырье и пр.

В таблице 2.1 приведены исходные данные. Предполагается, что контролируемый параметр распределен нормально с математическим ожиданием, равным номинальному значению, и дисперсией, определяемой допустимым отклонением на основании «правила трех сигм».

Таблица 3.2 Исходные данные для статистического регулирования изделий ФГУП «Спецмагнит»

Наименование изделия

Контролируемый параметр

Номинальное значение

Допуск на параметр

Допустимый разброс

«Литва»

Индукция

93мТл

±2,5%

0,85 мТл

«Акация»

Индукция

140мТл

±2,5%

1,05 мТл

«Тень»

Коэрцитивная сила

64кА/м

±5%

1,00 кА/м

«Воля»

Индукция

60мТл

±2,5%

0,70 мТл

В случае разладки технологического процесса среднее значение контролируемого параметра имеет тенденцию к уменьшению относительно номинального значения, а стандартное отклонение, напротив, возрастает.

Произведем оценку погрешности среднего значения , вычисленного по значениям х1, ,..., хп из некоторого распределения F. Данная задача имеет известное теоретическое решение, которое целесообразно сравнить с решением, полученным с  помощью метода бутстреп.

С этой целью отобрана выборка из 6 изделий «Акация», которые характеризуются следующими значениями индукции (в мТл): 140; 141,5; 139,5; 140,5; 138,9; 141,3. Номинальное значение контролируемого параметра составляет 140 мТл.

Произведем оценку и построим доверительный интервал по имеющейся выборке:

  1.  вычисляем оценку выборочного среднего

2) находим среднеквадратическое отклонение

3) по полученным данным построим доверительный интервал

Зададим доверительную вероятность и на основании полученных данных получаем доверительный интервал:

Вследствие того, что выборка слишком мала, полученный доверительный интервал,  в 2 раза шире доверительного интервала, соответствующего реальному распределению генеральной совокупности, который составляет . Такое отклонение является слишком большим, и, следовательно выборочное среднее значение  может быть недостоверным для надежной оценки среднего значения генеральной совокупности.

Классическая центральная предельная теорема дает гарантию того, что в случае выборки большого объема статистическая оценка среднего с большой вероятностью совпадает с истинным значением . Но в случае малой выборки нужна некоторая мера, при помощи которой можно было бы оценить статистическую достоверность вычисленного значения .

Такую меру дает метод бутстреп, который в рассматриваемом случае сводится к следующему алгоритму (при этом звездочкой будут помечаться величины, имеющие непосредственное отношение к бутстрепу):

1) построить эмпирическую оценку  неизвестного распределения F, приписывая вес 1/п  каждому значению  хi,  i=1,2,  ..., n;

F(x)=

0  при  x < 138,9

0,16  при  138,9 ≤ x < 139,5

0,33  при  139,5 ≤ x < 140

0,49  при  140 ≤ x < 140,5

0,66  при  140,5 ≤ x < 141,3

1  при   x ≥ 141,3

141,5

0,2

0,4

0,6

0,8

1

140

139,5

139

140,5

141

x

F(x)

Рис. 3.1. Эмпирическая функция распределения F

2)  осуществить случайный выбор с возвращением «псевдозначений» из распределения и вычислить оценку выборочного   среднего ;

;

;

.

3)   повторить предыдущий пункт алгоритма N раз, получая набор оценок , и вычислить среднеквадратическую ошибку выборочного среднего

, где ;

;

.

Заметим, что приписывание наблюдениям одинаковых  весов дает эмпирическую функцию распределения , которая служит довольно грубым приближением к неизвестной функции распределения F. Тем не менее, с ростом п эмпирическая функция распределения сходится к теоретической. Если же мы располагаем априорными сведениями о виде распределения F, то скорость сходимости можно увеличить, выбирая веса пропорциональными   распределению   F.

-0,3

0,9

0

0,3

0,6

-0,6

-0,9

 

Рис. 3.2. Частотная гистограмма для выборочного среднего, полученная по 100 выборкам бутстрепа (пунктир – теоретическое распределение)

С помощью этого алгоритма по 100 выборкам   бутстрепа  была   вычислена   среднеквадратическая ошибка среднего , которая оказалась равной 0.37. На рис. 3.2 приведена частотная гистограмма для этих выборок (по оси абсцисс — центрированное выборочное значение (0 соответствует 140 мТл, по оси ординат — число соответствующих значений в интервале 0,15).

4) по полученным данным построим доверительный интервал

;

Зададим доверительную вероятность и на основании полученных данных получаем доверительный интервал:

Доверительный интервал, полученный методом бутстреп практически совпадает с интервалом, соответствующим реальному распределению генеральной совокупности .

Рассмотрим теперь эту задачу с теоретической точки зрения. Обозначим через X1 ,…, Хп независимые случайные величины с общей функцией распределения F и пусть распределение F имеет среднее и дисперсию , оба из которых неизвестны. Общепринятой оценкой для служит выборочное среднее, которое обозначим через . Тогда, как отмечалось выше, для установления ошибки достаточно вычислить выборочное стандартное отклонение . А согласно центральной предельной теореме, распределение статистики при сходится к стандартному нормальному распределению. Пусть F* — эмпирическое  распределение выборки X1 ,…, Хп , обозначим через выборку бутстрепа из распределения . Тогда оценкой бутстрепа для служит величина , а распределение статистики  , где , ведет себя также, как и распределение статистики . Вследствие этого для  выборочного среднего (и для многих других статистических характеристик) доверительный интервал, полученный методом бутстреп, как правило, совпадает с интервалом, соответствующим реальному распределению генеральной совокупности.

4. Организационно-экономическая часть

Данная часть дипломной работы посвящена экономическому обоснованию разрабатываемой системы.

Прикладная статистика бурно развиваются последние десятилетия. Серьезным (хотя, разумеется, не единственным и не главным) стимулом является стремительно растущая производительность вычислительных средств. Поэтому понятен острый интерес к статистическим методам, интенсивно использующим компьютеры.

Целью статистических методов служит представление полученных данных в компактном, удобном и наглядном виде (свертка), обобщение их с помощью математических моделей и выработка решений об оптимальных дальнейших действиях.

Бутстреп отличается от традиционных методов тем, что он предполагает многократную обработку различных частей одних и тех же данных, как бы поворот их «разными гранями», и сопоставление полученных таким образом результатов.


4.1. Cоставление сметы затрат на выполнение работы и расчет трудозатрат

Стоимость разработки можно определить путем составления сметы затрат, которые в свою очередь, определяются путем расчета затрат по отдельным статьям расходов с их последующим суммированием:

  1.  Материалы, покупные изделия, полуфабрикаты.
  2.  Специальное оборудование.
  3.  Основная заработная плата персонала.
  4.  Дополнительная заработная плата персонала.
  5.  Отчисления в страховые фонды.
  6.  Командировки.
  7.  Контрагентские расходы.
  8.  Накладные расходы.

Затраты по статьям калькуляции 2, 6 и 7 отсутствуют.

Материалы, покупные изделия, полуфабрикаты.

Данные работы потребовали затрат, связанных с расходами материалов и покупных изделий. Сгруппируем основные материалы по отдельным видам с указанием единиц измерения и стоимостью в таблицу 4.2.1.

Таблица 4.2.1. Материалы, покупные изделия, полуфабрикаты.

№ п/п

Наименование

Единица измерения

Количество (штук)

Цена, рублей

Стоимость, рублей

1

2

3

4

5

6

1

Бумага

(формат А)

Пачка

2

250

500

2

Картридж для принтера

Шт.

1

3000

3000

3

Информационный носитель 8 Гб

Шт.

1

1300

1300

4

Канцтовары

-

-

200

200

Итого:

5000

Транспортные расходы составляют 15% от стоимости материалов, покупных изделий, полуфабрикатов:

5000 0,15 = 750 руб.

Всего по статье «Материалы, покупные изделия, полуфабрикаты» (с учетом транспортных расходов) затраты составляют:

5000 + 750 = 5750 руб.

Основная заработная плата персонала

Основная заработная плата вычисляется путем вычисления дневной заработной платы сотрудника и последующего умножения на количество дней, которое сотрудник отработал в проекте.

Основная заработная плата сотрудника вычисляется по формуле:

[З/П] = [Средняя дневная 3/П] [Число дней]       

Средняя дневная заработная плата равна окладу сотрудника, поделенному на количество рабочих дней в месяце:

[Средняя дневная 3/П] = [Оклад] / [22 рабочих дня]

Таблица 4.2.2. Основная заработная плата

Этапы

Исполни-тель

Трудо-емкость, дни

Оклад, руб

Оплата за день, руб

Оплата за этап, руб

1

Техническое

задание (ТЗ)

Начальник лаборатории

3

25000

1136

3408

Ведущий инженер

5

20000

909

4545

2

Техническое предложение (ТП)

Начальник лаборатории

4

25000

1136

4544

Ведущий инженер

3

20000

909

2727

Дипломник

7

10000

455

3185

Эскизно-технический проект:

3.1

Сбор и анализ существующей информации

Ведущий инженер

5

20000

909

4545

Дипломник

9

10000

455

4095

3.2

Разработка математического аппарата для использования метода бутстреп

Начальник лаборатории

Продолжение таблицы 4.2.2.

5

25000

1136

5680

Дипломник

7

10000

455

3185

3.3

Составление проекта методики исследования надежности наукоемкой продукции на основе метода бутстреп

Начальник лаборатории

10

25000

1136

11360

Ведущий инженер

8

20000

909

7272

Дипломник

34

10000

455

15470

3.4

Измерение и анализ полученных результатов

Ведущий инженер

2

20000

909

1818

Дипломник

5

10000

455

2275

3.5

Совершенствование (работы по внедрению, корректировке)

Ведущий инженер

4

20000

909

3636

Дипломник

15

10000

455

6825

3.6

Контроль результатов

Начальник лаборатории

4

25000

1136

4544

Дипломник

7

10000

455

3185

3.7

Итоговая презентация результатов

Дипломник

3

10000

455

1365

4

Подготовка документации и сдача темы

Начальник лаборатории

2

25000

1136

2272

Ведущий инженер

3

20000

909

2727

Итого:

98735

Дополнительная заработная плата персонала

На статью «Дополнительная заработная плата персонала» относят выплаты, предусмотренные КЗОТ РФ за не проработанное по уважительным причинам время: оплата очередных отпусков, времени, связанного с выполнением государственных и общественных обязанностей. Это составляет 30% от суммы основной заработной платы.

[Дополнительная З/П] = [З/П] 30%

[Дополнительная З/П] = 98735 0,3 = 29621 руб.

Суммарные затраты на заработную плату приведены в таблице 4.2.3.

Таблица 4.2.3. Затраты на заработную плату

Должность

Общая длительность работы, дней

Месячный оклад, руб

Сумма основной з/п, руб

Сумма дополни-тельной з/п, руб

Итого расходов на з/п, руб

Начальник лабратории

28

25000

31917

9575

41492

Ведущий инженер

30

20000

27273

8182

35455

Дипломник

87

10000

39545

11864

51409

Итого:

98735

29621

128356

Общая сумма выплат сотрудникам по заработной плате составит 128356 рублей.

Отчисления на страховые взносы

По налоговому кодексу, сумма отчислений на страховые взносы для каждого сотрудника зависит от налогооблагаемой базы. В данном случае эти отчисления составляют 34,2% к сумме основной и дополнительной заработной плате:

[Страховые взносы] = [Итоговая 3/П] 34,2%

                                  128356  0,342 = 43898 рублей

Накладные расходы

К статье «Накладные расходы» относятся транспортные расходы, а также расходы по содержанию и ремонту зданий, оборудования, инвентаря и другие расходы (100% от суммы основной заработной платы).

[Накладные расходы] = [Основная З/П] 100%

[Накладные расходы] = 98735 1 = 98735 рубля

Таблица 4.2.4. Итоговая таблица по смете затрат

Наименование статей затрат

Сумма, руб

1

Материалы, покупные изделия, полуфабрикаты.

5750

2

Специальное оборудование.

-

3

Основная заработная плата персонала.

98735

4

Дополнительная заработная плата персонала.

29621

5

Отчисления на страховые взносы.

43898

6

Командировки.

-

7

Контрагентские расходы.

-

8

Накладные расходы.

98735

Итого:

276739

Договорная цена состоит из общих затрат, прибыли и НДС. Поскольку разработка не тиражируется, то НДС в цену не входит. Норматив прибыли берем в размере 30% от стоимости разработки:

276739  0,3 = 83022 руб.

Договорная цена:

276739 + 83022 = 359761 руб.

Состав принимающих участие в работе:

В состав рабочей группы по проведению научно-исследовательской работы входят:

  1.  Начальник лаборатории (руководитель);
  2.  Ведущий инженер (консультант);
  3.  Дипломник (разработчик);

Участие руководителя в работе состоит в консультации дипломника по «общим» вопросам, возникающим в ходе  работы над поставленной задачей, проверке и утверждению выполненных этапов работы, а также согласовывает с ведущим инженером, последовательность и тип выполняемых исследований.

Ведущий инженер (консультант) предоставляет дипломнику необходимую специализированную литературу, а также информацию по исследуемой НИР и используемому программному обеспечению, контролирует выполнение дипломником исследовательской работы в соответствии с намеченным планом работ и вносит необходимые корректировки.

Дипломник (разработчик) изучает специализированную литературу, выполняет анализ  исходных данных, проводит необходимые исследования и анализирует их, согласовывает полученные результаты с ведущим инженером (консультантом) и руководителем и проводит их оформление в виде пояснительной записки.

Этапы разработки:

1. Техническое задание (ТЗ) [5 дней];

2. Техническое предложение (ТП) [7 дней];

3. Эскизно-технический проект:

3.1 Сбор и анализ существующей информации [9 дней];

3.2 Разработка математического аппарата для использования метода бутстреп [7 дней];

3.3 Составление проекта методики исследования надежности наукоемкой продукции на основе метода бутстреп [34 дня];

3.4 Измерение и анализ полученных результатов [5 дней];

3.5 Совершенствование (работы по внедрению, корректировке)

[15 дней];

3.6 Контроль результатов [7 дней];

3.7 Итоговая презентация результатов [3 дня];

4. Подготовка документации и сдача темы [3 дня].

Расчет трудоемкости работы

Наименования видов работ, должности исполнителей, трудоемкость, численность исполнителей и длительность выполнения каждого вида работ представлены в таблице 4.1.1.

Таблица 4.1.1. Этапы реализации проекта.

Этап разработки

Исполнитель

Трудоемкость, человеко-дней

Количество дней

1

Техническое

задание (ТЗ)

Начальник лаборатории

3

5

Ведущий инженер

5

2

Техническое предложение (ТП)

Начальник лаборатории

4

7

Ведущий инженер

3

Дипломник

7

3

Эскизно-технический проект:

3.1

Сбор и анализ существующей информации

Ведущий инженер

5

9

Дипломник

9

3.2

Разработка математического аппарата для использования метода бутстреп

Начальник лаборатории

5

7

Дипломник

7

3.3

Составление проекта методики исследования надежности наукоемкой продукции на основе метода бутстреп

Начальник лаборатории

10

34

Ведущий инженер

Продолжение таблицы 4.1.1.

8

Дипломник

34

3.4

Измерение и анализ полученных результатов

Ведущий инженер

2

5

Дипломник

5

3.5

Совершенствование (работы по внедрению, корректировке)

Ведущий инженер

4

15

Дипломник

15

3.6

Контроль результатов

Начальник лаборатории

4

7

Дипломник

7

3.7

Итоговая презентация результатов

Дипломник

3

3

4

Подготовка документации и сдача темы

Начальник лаборатории

2

3

Ведущий инженер

3

Итого:

145

95

Общий итог

Трудоемкость выполняемых работ снижается за счет компьютеризации всех вычислений, будет сведен к минимуму ручной труд. Следовательно, предприятие получает большую экономическую выгоду, так как можно будет сократить штат работников.

Продолжительность не превышает установленных норм и показывает лучшее использование планового рабочего времени. Хотя предприятие могло бы уменьшить его за счет сокращения простоев, связанных с организационными вопросами.


4.2. Разработка бизнес-плана и составление календарного графика выполнения проекта

Данная работа относится к научно-исследовательской разработке (НИР), так как результатом является анализ состояния производства ИРЭ на предприятии путем выявления всех типов дефектов, потерь и издержек, а также разработка проектов по устранению данных проблем с помощью применения данного метода.

Источником финансирования являются отчисления от прибыли предприятия ФГУП «Спецмагнит» и денежные средства собственников компании, привлекаемые для реализации инвестиционных проектов.

Заказчиком НИР является ФГУП «Спецмагнит». Исполнителями  работы является группа сотрудников кафедры технологических основ радиоэлектроники (ТОРЭ) МИРЭА.

В рамках  договора исполнители обязуются выполнить данную работу в срок и в полном объеме. Прием результатов исследования осуществляет комиссия. Срок сдачи – 10 июня 2012г.

Заказчик обязуется предоставить требуемые условия и средства для реализации данного проекта, а также вовремя расплатиться с разработчиками, заработная плата выплачивается с учетом темпа инфляции.

По условиям  договора исполнители обязуются выполнить данную работу в срок и в полном объеме.

1. Проектируемый продукт предназначен для применения и использования в регулировании технологических процессов при производстве  изделий радиоэлектроники. При использовании данного метода повышается точность контроля, соответственно уменьшается доля бракованной продукции, снижается риск необоснованных регулировок технологического процесса.

2.  Конкуренция отсутствует, поскольку разрабатывалась оригинальная методика «бутстреп», которая предполагает многократную обработку различных частей одних и тех же данных выборки и позволяет исследовать надежность наукоемкой продукции.

2. Потребительский рынок составляют компании-производители  изделий радиоэлектроники, стремящиеся сократить расходы и повысить качество выпускаемой продукции.

3. Цена на изделие будет установлена в зависимости от объема и важности работы.

4. Рекламная компания будет проведена после подготовки демонстрационной версии (выставки, научные публикации в отраслевых журналах).

5. Организация послепродажного обслуживания будет включать в себя бесплатный выпуск упрощенных инструкций, сопровождение продукта  полной документацией.

6. Для защиты от несанкционированного доступа используется Законодательство РФ.

7. Риски устанавливаются заранее и являются контролируемой величиной и зависят от  требования к качеству изготавливаемой продукции.

В организационно-экономической части дипломной работы раскрывается краткое содержание основных разделов бизнес-плана проекта, проводится анализ требуемых затрат времени и денежных средств для его реализации.

Организационная схема проекта, приведенная в этом разделе показывает, что для его выполнения необходима группа экспертов из трех человек, которые должны реализовать проект за 95 рабочих дней.

Стоимость реализации проекта составит 359761 рубль.

Экономическая целесообразность реализации данного проекта  доказана, так как данная система обладает многими преимуществами перед конкурирующими системами.


Этапы

1

2

3.1

3.2

3.3

3.4

3.5

3.6

3.7

4

1

3

5

7

9

11

13

15

17

19

21

23

25

27

29

31

33

35

37

39

41

43

45

47

49

51

53

55

57

59

61

63

65

67

69

71

73

75

77

79

81

83

85

87

89

91

93

Дни

95


5.1.2. График работ

Таблица 5.1.2.Этапы работы

Этап работы

1

Техническое задание (ТЗ)

2

Техническое предложение (ТП)

3.1

Сбор и анализ существующей информации

3.2

Разработка математического аппарата для использования метода бутстреп

3.3

Составление проекта методики исследования надежности наукоемкой продукции на основе метода бутстреп

3.4

Измерение и анализ полученных результатов

3.5

Совершенствование (работы по внедрению, корректировке)

3.6

Контроль результатов

3.7

Итоговая презентация результатов

4

Подготовка документации и сдача темы


4.3. Технико-экономическое обоснование целесообразности выполнения работ

Использование статистического метода “бутстреп ‘ позволяет  произвести оценку параметров изделий радиоэлектроники.

Методом «бутстреп» установлено, что разработанная методика дает выигрыш в уменьшении объема выборки.  

Предложенная методика доведена  до уровня, обеспечивающего возможность ее практического применения, что позволит:

  1.  существенно сократить длительность статистического анализа;
  2.  уменьшить энергетические и иные затраты на проведение испытаний;
  3.  более оперативно получать информацию, необходимую для управления технологическими процессами;
  4.  повысить точность контроля;
  5.  уменьшить долю бракованной продукции;
  6.  поддержание технологического процесса в стабильном, статистически управляемом состоянии;
  7.  значительно повысить качество продукции.

Бутстреп пригоден для работы с любыми статистическими задачами, будь то проверки гипотез о законах распределения случайных величин, регрессия, дисперсионный анализ или многомерная классификация данных.

Актуальность данного метода заключается в том, что производить качественную конкурентоспособную продукцию – это очень выгодно. Ведь качественная продукция характеризуется минимальными издержками, и каждый проект должен принести ощутимый доход, как минимум, в 5 раз превышающий затраты. Именно поэтому метод “бутстреп” стал таким популярным для исследования надежности наукоемкой продукции.

Заключение

Бутстреп появился для того, чтобы бороться со смещением, обусловленным выборкой. Затем выяснилось, что его стоит использовать для оценки выборочной дисперсии. Ну а от дисперсий рукой подать до доверительных границ и проверки гипотез. Таким образом, это универсальный метод.

Бутстреп пригоден для работы с любыми статистическими задачами, будь то проверки гипотез о законах распределения случайных величин, регрессия, дисперсионный анализ или многомерная классификация данных. Конечно, во многих случаях в бутстрепе нет необходимости, да и обходится он недешево, поскольку требует большого объема вычислений. Но там, где раньше возникали различные трудности, теперь нам на помощь приходит бутстреп. Он начал широко применяться; например, в моделях пропорционального риска Д. Кокса, а также в моделях с цезурированными данными, столь характерными дли задач надежности, прогнозирования, медицинской диагностики и т. п. Долгое время не удавалось преодолеть статистических трудностей в моделях нелинейной по параметрам регрессии. Теперь и в этой области наметился прогресс благодаря «бутстрепизации», не нуждающейся в априорном знании закона распределения остатков. В настоящее время построение доверительных интервалов представляется наиболее важной практической стороной использования этого метода.

Среди опубликованных до сих пор прикладных задач обращает на себя внимание преобладание медицинских исследований. Причины такого положении пока не ясны. Другая естественная область — надежность.

Можно предполагать, что одно из главных предназначений бутстрепа — стать важным элементом в новом поколении программ для ЭВМ по статистическим методам, программ, которые будут в значительно большей степени, чем существующие, использовать методы наглядного представления и анализа данных и идеи экспертных систем.

В данной дипломной работе были рассмотрены методы размножения выборок, и в частности бутстреп, который отличается от традиционных методов тем, что он предполагает многократную обработку различных частей одних и тех же данных, как бы поворот их «разными гранями», и сопоставление полученных таким образом результатов.

Доказано, что технология бутстреп имеет ряд преимуществ перед классической. Использование данного метода дает возможность многократного размножения выборки. Это, в частности, позволяет получить достаточно точные оценки показателей надежности уникальных изделий электронной техники.

Разработан математический аппарат метода бутстреп для точности и достоверности оценки показателей надежности изделий радиоэлектроники.

В организационно-экономической части работы проведены технико-экономическое обоснование, организация и планирование работы по теме, а также рассчитана смета затрат на научно-исследовательскую разработку метода бутстреп, заказчиком которого является ФГУП «Спецмагнит».

 

Список использованной литературы

  1.  Б. Эфрон. Нетрадиционные методы многомерного статистического анализа: Сборник статей. Пер. с английского  Ю. П. Адлера, Ю. А. Кошевника, В. Н. Солнцева. – М.: Финансы и статистика, 1988. – 263 с.
  2.  А. И. Орлов. Эконометрика. Учебник. – М.: Экзамен, 2002. – 576 с.
  3.  Л. В. Гаев, М. Ю. Шмарион. Компьютерное исследование бутстреп-моделирования // Современные проблемы информатизации. Тезисы докладов второй электронной научной конференции.- Воронеж: ВГПУ, 1997. 176 с.
  4.  Л. В. Гаев. О поведении бутстреп-оценки вероятности успеха в одном испытании Бернулли // Современные проблемы математики и естествознания. Материалы пятой Всероссийской научно-технической конференции. Н. Новгород: МВВО АТН РФ, 2003. 6–7 с.
  5.  С. М. Ермаков, Г. А. Михайлов. Статистическое моделирование. – М.: Наука, 1982. – 296 с.
  6.  И.М. Иванова. Случайные числа и их применения. – М.: Финансы и статистика, 1984. – 109 с.
  7.  C. Р. Рао. Линейные статистические методы и их применения. – М.: Наука, 1968. – 548 с.
  8.  В. И. Асатурян. Теория планирования эксперимента. – М.: Радио и связь, 1983. – 248 с.
  9.  П. Диаконис, Д. Эфрон. Статистические методы с интенсивным использованием ЭВМ // В мире науки. – 1983. – № 7. – с. 60 – 73
  10.  Б. В. Вишняков, А. И. Кизбун. Применение метода бутстрепа для оценивания функции квантили // Автоматика и телемеханика. – 2007. –№ 11. – с. 46 – 60
  11.  Д. Тоберн. Доверительные интервалы, основанные на модифицированном бутстрепе // Теория вероятностей и ее применения. – 1992. – Т. 32. – Вып. 2. – с. 390 – 392
  12.   А. Володин, Ордоньес Кабрера М., Ху Т. З. Скорость сходимости для зависимого бутстрепа среднего // Теория вероятностей и ее применения. – 2005. – Т. 50. – Вып. 2. – с. 344 – 352
  13.   Н. В. Грибкова, Р. Хэлмерс. О состоятельности M <<N-бутстреп-аппроксимации распределения усеченного среднего // Теория вероятностей и ее применения. – 2010. – Т. 55. – Вып. 1. – с. 3 – 18
  14.   Ю. А. Кошевник. Асимптотические свойства бутстреп-оценок (Обзор). // Заводская лаборатория. – 1987. – Т. 53. – № 10. – с. 76 – 82
  15.   А. И. Орлов. О реальных возможностях бутстрепа как статистического метода. // Заводская лаборатория. – 1987. – Т. 53. – № 10. – с. 82 – 85
  16.   Ю. П. Адлер, И. В. Гадолина, М. Н. Ляндрес. Бутстреп-моделирование при построении доверительных интервалов по цензурированным выборкам. // Заводская лаборатория. – 1987. – Т. 53. – № 10. – с. 90 – 94
  17.   Б. Б. Походзей, В. А. Хрущев. Бутстреп как метод оценки изменчивости геолого-технологических параметров руд (Обобщающая статья). // Заводская лаборатория. – 1987. – Т. 53. – № 10. – с. 86 – 90
  18.  Arenal-Gutierrez E., Matrdn С, Cutsta-Albertos J. A. On the unconditional strong law of large numbers for the bootstrap mean. — Statist. Probab. Lett., 1996.  v. 27 №1  p. 49  60.
  19.  Bickel P. J., Preedman D. Some asymptotic theory for the.bootstrap. — Ann. Statist., 1981.  v. 9  p. 1196  1217.
  20.  Li D., Rosalsky A., Ahmed S.E. Complete convergence of bootstrapped means and moments of the supremum of normed bootstrapped sums. — Stochastic Anal. Appl., 1999.  v. 17. №5  p. 799  814.
  21.  Hall P. Methodology and theory for the bootstrap. Ed. Engle R.F. and McFadden D.F. Handbook of Econometrics, 1994. – v. 4. Ch. 39.
  22.  С. Л. Блюмин, Л. В. Гаев, М. Ю. Шмарион. Характеристика бутстреп-оценки математического ожидания бернуллиевской случайной величины. // Вестник ЛГТУ-ЛЭГИ. – 2001. – № 1.
  23.   С. Я. Гродзенский; Под ред. В. П. Марина «Статистические методы контроля и управления качеством»: Учеб. пособие /. — М.: МИРЭА, 2006. — 83 с.
  24.   Шитиков В.К. Статистические методы ресамплинга: рандомизация и бутстреп
  25.   Mathematics and Computer Education
  26.   Calzada, Maria E «Confidence intervals for the mean: to bootstrap or not to bootstrap» // Mathematics and Computer Education January 1, 2011
  27.   B. Efron. Bootstrap methods: Another look at the jackknife // Ann Statist., – 1979. – v. 7. – p. 1 – 26
  28.   Mikosch T. Almost sure convergence of bootstrapped means and statistics. — J. Statist. Plann. Inference, 1994. v. 41 № 1 p. 119.
  29.   Smith W., Taylor R.L. Dependent bootstrap confidence intervals. — IMS Lecture Notes Monogr. Ser., 2001. v. 37 p. 91 107.
  30.   В. С.Муравьева, А. И. Орлов. Организационно-экономические проблемы прогнозирования на промышленном предприятии // Управление большими системами. –М.: ИПУ РАН. – 2007. –Вып. 17. – с. 143 – 158


ПРИЛОЖЕНИЯ

Содержание

Область применения

Нормативные ссылки

Термины и определения

Общая схема моделирования статистических испытаний на основе метода «бутстреп»

 Общее описание алгоритма

Анализ результатов и сравнение эффективности метода «бутстреп» с классическим методом и методом складного ножа


1. Область применения

Настоящая методика предназначена для оценки показателей надежности изделий радиоэлектроники при помощи метода «бутстреп» на ФГУП "Спецмагнит".

Цель методики: улучшение качества статистических испытаний ИРЭ, выпускаемых небольшими партиями, выявление недостатков, присущих классическому методу и анализ ситуаций, в которых применение метода наиболее актуально и эффективно.

Настоящий документ разъясняет область применения метода «бутстреп».

2. Нормативные ссылки

В настоящей методике использованы ссылки на следующие стандарты и методологии:

ГОСТ Р 50779.0-95 Статистические методы. Основные положения

ГОСТ Р 50779.30-95 Статистические методы. Приемочный контроль качества. Общие требования.

ИСО/ТО 10017:2003 «Руководство по статическим методам применительно к ИСО 9001:2000»

3. Термины и определения

Статистика - измеримая функция результатов наблюдений, включенных в выборку, используемая для получения статистических выводов.

Выборка - совокупность значений одного и того же признака у подвергнутых наблюдению объектов.

Эмпирическое распределение - распределение случайного элемента, в котором каждому результату наблюдения, включенному в выборку, соответствует одна и та же вероятность, равная обратной величине объема выборки. Если в выборку включены результаты наблюдений x1, x2,...., xn, то эмпирическое распределение - это распределение случайной величины Х такой, что Р(Х= xi) = 1/n, i = 1,2,..., n. Если несколько результатов наблюдений совпадают: x1 = x2 =.... = xk = a, то полагают Р(Х=а) = k/n.

Математическое ожидание — мера среднего значения случайной величины.

Стандартное отклонение — показатель рассеивания значений случайной величины относительно её математического ожидания.

Оценка - результат оценивания по конкретной выборке. Оценка является статистикой, а потому случайным элементом, в частных случаях - случайной величиной или случайным вектором.

4. Общая схема моделирования статистических испытаний

Общая схема моделирования статистических испытаний на основе метода «бутстреп» насчитывает 6 основных операций:


  1.  Оценка параметра классическим методом
  1.  Формирование генеральной совокупности

  1.  Получение «псевдовыборок»

  1.  Получение множества бутстреп-оценок

  1.  Усреднение полученных значений

  1.  Сравнение результатов


5.
Общее описание алгоритма

Для оценки распределения статистики f(X) по выборке

X = (x1,  x2 , …, xn)

предлагается сформировать много бутстреп-выборок

Y1 ,Y1 , … , Yn 

и в качестве оценки использовать распределение величин

f(Y1), f(Y2), … , f(Yn).

Выборку Yi формируют так: для каждого

j = 1, 2, … , n

методом статистических испытаний определяют случайный номер k(j), равномерно распределенный на множестве {1, 2, … , n}, и полагают

Yi= (xk(1) , xk(2) , … , xk(n) )

Предполагается, что номера k(1), k(2), … , k(n) выбираются независимо друг от друга.

Оценка стандартного отклонения для бутстрепа:

θi = случайная величина, извлеченная с возвращением из наблюденных значений. Тогда

θ* =∑θi/n.

6. Анализ результатов и сравнение эффективности метода «бутстреп» с классическим методом и методом складного ножа

Исходными данными для моделирования являются:

  1.  Распределение Вейбулла
  2.  число реализаций (под реализацией понимается количество размножений исходной выборки)
  3.  значения исследуемого параметра, соответствующее альтернативным статистическим методам
  4.  фактическое значение контролируемого параметра (λисх=0,001)

В результате оценивается средняя интенсивность отказов технической системы классическим методом, методом складного ножа и методом «бутстреп».


Время наработки на отказ (
ti) при каждом наблюдении:

ti =  где S – параметр формы, i – номер наблюдения.

Интенсивность отказов:

λ ср.=

Результаты моделирования статистических испытаний  построенных на основе метода «бутстреп» для распределения Вейбулла сведены в таблицу Эти данные позволили провести сравнительный анализ эффективности исследуемых статистических методов.

Итоговая таблица

S

λ

λjack

λboot

σ

σjack

σboot

N=5

0,5

0,0022131

0,0022131

0,0021583

0,0027803

0,0000279

0,0002753

1

0,0011827

0,0011827

0,0011822

0,0006027

0,0000061

0,0000659

2

0,0010295

0,0010295

0,0010274

0,0002555

0,0000026

0,0000269

N=10

0,5

0,0015549

0,0015549

0,0015460

0,0009692

0,0000098

0,0000254

1

0,0010954

0,0010954

0,0010969

0,0003439

0,0000035

0,0000375

2

0,0010127

0,0010127

0,0010109

0,0001650

0,0000017

0,0000184

N=100

0,5

0,0010424

0,0010424

0,0010438

0,0002440

0,0000025

0,0000254

1

0,0010132

0,0010132

0,0010136

0,0001086

0,0000011

0,0000116

2

0,0010052

0,0010052

0,0010061

0,0000544

0,0000005

0,0000057

Диаграмма, показывающая разброс контролируемого параметра от его истинного значения


 

А также другие работы, которые могут Вас заинтересовать

47228. Экологизация школьного курса географии в аспекте загрязнения гидросферы 115.5 KB
  Загрязнение воды в настоящее время является проблемой угрожающей всему человечеству. Обеззараживание питьевой воды проводится для уничтожения в загрязненной воде используемой человеком возбудителей заболеваний передающихся водным путем и для предупреждения передачи кишечных инфекций через воду. С питьевой водой в организм человека могут попасть всевозможные микробы возбудители многих инфекционных и паразитарных заболеваний: холера брюшной тиф дракункулез лямблиоз вирусный гепатит полиомиелит дизентерия сальмонеллезы шистосомозы и...
47229. Цифровые лаборатории как средство современного школьного химического образования 362.97 KB
  Компьютерные модели в обучении химии. Компьютерные модели макромира. Компьютерные модели в обучении химии Среди различных типов педагогических программных средств многие авторы особо выделяют те в которых используются компьютерные модели.
47230. Экологизация в учебно-воспитательной работе 70 KB
  Ход мероприятия: 1 Действие На сцене – край леса. А есть еще природы храм – С лесами тянущими руки Навстречу солнцу и ветрам. Ты же видишь мы свои Ученик 3: Привет тебе мой край родной С твоими темными лесами...
47231. РЕКОМЕНДАЦИИ ПО ПОВЫШЕНИЮ РЕЗУЛЬТАТОВ ФИНАНСОВОЙ ДЕЯТЕЛЬНОСТИ СИБИРСКОГО БАНКА СБЕРБАНК РОССИИ 386.12 KB
  Многообразие факторов, оказывающих влияние на результаты деятельности коммерческих банков, определяет необходимость рассмотрения этих результатов в процессе их исследования как многофункциональной и многоцелевой экономической системы.
47232. МЕТОДИКА РАСЧЕТА ВЫБРОСОВ ЗАГРЯЗНЯЮЩИХ ВЕЩЕСТВ ОТ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ АВТОМОБИЛЬНЫХ ПАРКОВ ВОЙСКОВЫХ ЧАСТЕЙ 1.21 MB
  ТРЕБОВАНИЯ ПО ЭКОЛОГИЧЕСКОЙ БЕЗОПАСНОСТИ ОБЬЕКТОВ ВООРУЖЕНЯ И ВОЕННОЙ ТЕХНИКИ РВСН 1. Но требования обеспечения экологической безопасности существенно и принципиально расширяют представление о качестве и не всегда связывают его с целевым назначением объекта. Для оценки степени экологической безопасности объекта вполне пригоден показатель ресурсной эффективности выраженный отношением полученных результатов к использованным ресурсам. Необходимо учитывать что в условиях использования больших технических систем концепция абсолютной...
47233. Предсказание коммуникационных расходов параллельных программ 205 KB
  Параллельное программирование На сегодняшний день параллельные вычислительные системы дают наибольшую производительность в решении задач требующих большого количества вычислений часто на больших объемах данных. MPI. Самая распространенная реализация модели передачи сообщений – это стандарт MPI Messge Pssing Interfce описывающий ряд функций для обмена данными между отдельными процессами или внутри...
47234. Метод обнаружения удаленных атак 331 KB
  АНАЛИЗ УДАЛЕННЫХ АТАК СЕТЕВАЯ безопасность ПРОТОКОЛЫ TCP IP ОБНАРУЖЕНИЕ АТАК Настоящая дипломная работа содержит результаты анализа удаленных атак и разработку Далее краткая сводка о выполненной работе.
47235. Гидропневматическая система подрессоривания с лопастным аморитзатором для быстроходной гусеничной машины массой 18 тонн 331.88 KB
  напрямую влияет на точность стрельбы с ходу и скорость машины на марше. Колебания кузова машины обуславливают появление толчков и ударов возникающих при ее движении по неровностям утомляют водителя снижают остроту восприятия им быстроменяющихся условий движения. ГПР представляет из себя двухтрубную конструкцию расположенную горизонтально вдоль борта машины. ГПП оснащена автоматом разгрузки предназначенным для защиты упруго элемента пневмоцилиндра от сжатия его высоким давлением жидкости в процессе подъёма машины при увеличении клиренса.