6507

Подбор закона распределения по опытным данным и проверка его согласия по критериям χ2 и Колмогорова

Лабораторная работа

Математика и математический анализ

Подбор закона распределения по опытным данным и проверка его согласия по критериям. Выборка случайной величины объёмом...

Русский

2013-01-04

73.39 KB

83 чел.

Подбор закона распределения по опытным данным и проверка его согласия по критериям χ2 и Колмогорова

  1. Исходные данные

В таблице 1 приведена выборка результатов измерения веса 100 студентов обучающихся на 1ом курсе в педагогическом институте. Измерения проводились с точностью до 1 кг:

Таблица 1 Выборка случайной величины объёмом n=100

70

70

78

83

68

75

86

75

77

83

85

83

83

78

70

71

74

81

63

70

80

75

80

80

78

69

71

88

66

78

88

73

78

78

83

86

84

68

78

82

73

70

81

63

70

78

74

79

75

73

78

83

87

66

78

89

93

78

83

68

78

75

68

78

81

74

78

83

90

86

70

80

74

75

73

79

84

84

67

76

85

75

79

82

68

79

80

78

70

71

73

93

84

90

85

69

94

81

78

88

1.1 Исключение ложных результатов в выборке

Для исключения из экспериментальных данных грубых ошибок (ложных результатов) воспользуемся критерием Стьюдента

где  – математическое ожидание случайной величины x,  – среднее квадратичное отклонение т.е. корень квадратный дисперсии,  – критерий Стьюдента берётся из таблице.

Поскольку, выборка объёмом 100, то для исключения ложных результатов удобней воспользоваться методом вычисления максимального относительного отклонения:

где – крайний (наибольший или наименьший) элемент выборки. Таким образом, для выделения аномального значения вычисляют τ, которое сравнивают с табличным значением . Если неравенство  соблюдается, то наблюдение не отсеивают, если не соблюдается, то наблюдение исключают.

Максимальное значение в данной выборке равняется Xmax=94, а минимальное значение Xmin=63. Рассчитаем математическое ожидание:

И среднее квадратичное отклонение:

Для  рассчитываются по формуле (1) τ

Далее из выбирают наибольшее. Для отсева грубых погрешностей удобно максимальные относительные отклонения разделить на три неравенства:

Из таблицы распределения Стьюдента:  ,

Подставляя найденные значения τ при , получаем, что выполняется неравенство (5), следовательно, рассматриваемые значения не исключаем, так как весомых аргументов в их ошибочности нет.

  1.  Оценка числовых характеристик распределения:
  2.  Среднее арифметическое рассчитывается по формуле (2) и принимает значение равное 77.78
  3. Эмпирическая дисперсия:

  1. Среднеквадратическое отклонение рассчитывается по формуле (3) и принимает значение = 6.941
  2.  Выборочное значение коэффициент вариации, является мерой относительной изменчивости наблюдаемой случайной величины в %, вычисляют по формуле:

  1.   Выборочный коэффициент асимметрии (скошенности) это количественная характеристика показывающая сходство с нормальным распределением и рассчитываемая по формуле:

Коэффициент асимметрии положителен, т.е. плотность распределения обладает положительной асимметрией

  1.  Выборочный коэффициент эксцесса (островершинности) это количественная характеристика островершинности распределения, которая вычисляется по формуле:

Эксцесс отрицателен, следовательно, вершина более пологая.

  1.  Статистическая проверка случайности и независимости результатов наблюдений

Рассмотрим критерий серий, основанный на медиане выборки.

Так как значение n – чётное, то выборочное значение медианы принимает вид

В исходной выборке вместо каждого хi будем ставить "+", если хi>xmed(n), "-", если хi < xmed(n). Если хi = xmed(n), то не ставится никакой знак. Полученная последовательность "+" и "-" может характеризоваться количеством серий (n) и длиной самой длинной серии (n). При этом под серией понимается последовательность подряд идущих "+" или "-". Серия может состоять только из одного "+" или "-". Длина серии – количество подряд идущих "+" или "-". Если выборка стохастически независима (выборка случайна), то чередование плюсов и минусов в последовательности должно быть случайно. Таким образом, в данном критерии рассматриваются две критические статистики . 

где в квадратных скобках неравенства обозначена […] – целая часть,  - число серий, τ(n) – длина самой длинной серии.

Рассмотрим второй критерий - Критерий «восходящих» и «нисходящих» серий.

По аналогии с критерием серий, основанном на медиане выборки, в ранговом критерии «восходящих» и «нисходящих» серий также формируется последовательность серий "+" и "-". Для этого в исходной выборке из генеральной совокупности xi, i =  на месте i-го элемента ставят "+" если хi+1 > xi, и "-" если хi+1 < xi. Если хi+1 = xi, то в серии ничего не проставляется.

При уровне значимости q=0.05 количественное выражение этого правила примет вид:

где  - число серий, τ(n) – длина самой длинной серии,   – принимает значение 6 так как объём выборке удовлетворяет неравенству 26<n<153.

  1.  Проверка нормальности распределения

Критерий, основанный на вычислении среднего абсолютного отклонения (САО).

Для выборки n > 120 среднее абсолютное отклонение вычисляется по формуле:

Для выборки, имеющий приближенно нормальный закон распределения, должно быть справедливо выражение:

Подставляя значения в данное неравенство получаем , следовательно неравенство выполнено выборка имеет приближённо нормальный закон распределения.

Критерий, основанный на анализе показателей асимметрии и эксцесса.

В случаи нормального распределения характеристики асимметрии и эксцесса должны быть нулевыми. Вычислим выборочные характеристики асимметрии  по формуле 7 и эксцесса по формуле 8.

 

Далее определим среднеквадратическое отклонение выборочных асимметрий и эксцесс соответственно:

Если выполняются два неравенства,

то гипотеза о нормальном законе распределения рассматриваемой случайной величины принимается.

Подставляя полученные значения в неравенство (9) получаем:

Гипотеза о нормальном законе может быть принята.

  1.  Построение гистограммы, полигона и кумулянты.

Разделим данные выборки на классы и построим полигон, гистограмму и кумулянту частот. Гистограмма и полигон дают графическое представление об эмпирической функции плотности этой переменной, а кумулятивная кривая – о её эмпирической функции распределения. Для этого выполним следующие преобразования:

1) находим xmin=63 и xmax=94, Размах выборки R= xmax- xmin = 31;

2) n=100 наблюдений;

3) Определяем длину интервала разбиений:

Длину интервала принимаем равной 4.0, число интервалов возьмём 8.

4) Разбиваем массив данных на интервалы и вычисляем частоту. Результаты этой операции представлены в таблице 2.

Таблица 2.

Интервал веса

Середина интервала

Частоты

абсолютные

относительные

относительные накопленные

от 62 до 66

64

4

0.04

0.04

от 66 до 70

68

17

0.17

0.21

от 70 до 74

72

10

0.1

0.31

от 74 до 78

76

25

0.25

0.56

от 78 до 82

80

16

0.16

0.72

от 82 до 86

84

18

0.18

0.9

от 86 до 90

88

7

0.07

0.97

от 90 до 94

92

3

0.03

1

5) После составления таблицы строим полигон, гистограмму и кумулянту распределения результатов наблюдения:

Рис.1. Полигон распределения

Рис.2. Гистограмма распределения

Рис. 3. Кумулянта распределения

По виду гистограммы подбираем закон распределения случайной величины. В данной работе имеем гистограмму близкую к гистограмме нормального закона распределения.

Нормальный закон:

,

Проверим по критериям согласия, будут ли опытные данные согласоваться с нормальным законом распределения.

  1.  Проверка согласия опытных данных с нормальным законом распределения по критерию

Условие:

где r – число интервалов, на которые разбиты исходные опытные данные; ni – число опытных данных, попавших в i-ый интервал (абсолютная частота);  - теоретическое число, попавшее в i-ый интервал.

где n - объём выборки.

В случае нормального закона распределения

где  (значения данной функции берутся из таблицы её значений).

Для первого интервала левый конец изменим на -, а для последнего интервала правый конец на + . Таким образом, первый интервал будет (-; 66), а последний (90; + ). Расчёт  приведён в табл. 3; 4; 5.

Таблица 3

i

Границы интервала

xi - 

xi +1 - 

Границы интервалов

zi=

zi+1=

xi

xi+1

1

-

66

-

-11.78

-

-1.6972

2

66

70

-11.78

-7.78

-1.6972

-1.1209

3

70

74

-7.78

-3.78

-1.1209

-0.5446

4

74

78

-3.78

0.22

-0.5446

0.0317

5

78

82

0.22

4.22

0.0317

0.608

6

82

86

4.22

8.22

0.608

1.1843

7

86

90

8.22

12.22

1.1843

1.7606

8

90

+

12.22

-

1.7606

+

Таблица 4

i

Границы интервала

(zi)

(zi+1)

Pi = (zi+1) - (zi)

=100Pi

     zi

     zi+1

1

-

-1.6972

-0.5

-0.4552

0.0448

4.48

2

-1.6972

-1.1209

-0.4552

-0.3688

0.0864

8.64

3

-1.1209

-0.5446

-0.3688

-0.207

0.1618

16.18

4

-0.5446

0.0317

-0.207

0.0126

0.2196

21.96

5

0.0317

0.608

0.0126

0.2284

0.2158

21.58

6

0.608

1.1843

0.2284

0.3819

0.1535

15.35

7

1.1843

1.7606

0.3819

0.4608

0.0789

7.89

8

1.7606

+ 

0.4608

0.5

0.0392

3.92

Таблица 5

i

ni

ni -

(ni - )2

(ni - )2 /

/

1

4

4.48

-0.48

0.2304

0.05143

16

3.57

2

17

8.64

8.36

69.8896

8.0891

289

33.45

3

10

16.18

-6.18

38.1924

2.3605

100

6.18

4

25

21.96

3.04

9.2416

0.4208

625

28.46

5

16

21.58

-5.58

31.1364

1.4428

256

11.86

6

18

15.35

2.65

7.0225

0.4575

324

21.11

7

7

7.89

-0.89

0.7921

0.1004

49

6.21

8

3

3.92

-0.92

0.8464

0.2159

9

2.30

Σ

100

100

13.1384

113.14

Столбцы  и  служат для контроля вычисления по формуле:

. Вычисления произведены правильно.

По таблице критических точек распределения χ2, по уровню значимости α=0.01 и числу степеней свободы k=S-3=8-3=5 (S-число интервалов, 3-количество неизвестных параметров нормального закона распределения), находим критическую точку

Имеем , следовательно, выдвинутая гипотеза о нормальном законе распределения принимается, т.е. опытные данные согласуются с нормальным законом распределения.

  1.  Проверка согласия опытных данных с нормальным законом распределения по критерию Колмогорова.

λ=D, где n-объём выборки; Необходимо  вычислить

где  и  теоретическая и эмпирическая функции распределения.

Расчёты согласия по критерию Колмогорова приведены в таблице 6, где nx и -суммы опытных и теоретических данных меньших x.

Таблица 6

ni

nx

F(x) =

F*(x) =

4

4

4.48

4.48

0.04

0.0448

0.0048

17

21

8.64

13.12

0.21

0.1312

0.0788

10

31

16.18

29.3

0.31

0.293

0.017

25

56

21.96

51.26

0.56

0.5126

0.0474

16

72

21.58

72.84

0.72

0.7284

0.0084

18

90

15.35

88.19

0.9

0.8819

0.0181

7

97

7.89

96.08

0.97

0.9608

0.0092

3

100

3.92

100

1

1

0

D = 0.0788; при n=100; 

λ=D = 0.0788· = 0.788; При α = 0.2, λкр = 1.073;

Имеем λ < λкр , следовательно, по критерию Колмогорова имеем, что опытные данные согласуются с нормальным законом распределения.

  1.  Графики функций плотности и распределения.


 

А также другие работы, которые могут Вас заинтересовать

24369. Античный этап развития науки: логика и математика 104 KB
  Первые европейские ученые и философы любители мудрости Фалес Анакасимен Анаксимандр Гераклит опираясь на факты и логику впервые мыслили вещи не фантастически а стремились к естественнонаучном безличному целостному описанию природы космоса мира. Осуществляя многочисленные наблюдения за поведением планет Солнца природных и общественных явлений используя также и мифологически воззрения от них полностью устраниться не удалось они пытались найти как общие законы изменения и устройства мира так и частные его характеристики....
24370. Наука средневековья. Роль христианской теологии в изменении созерцательной позиции ученого 114 KB
  Начало мира это сам Бог. В результате христианское учение постепенно стало приобретать форму рациональной теологии где определенное место отводилось вопросам познания устройства мира. Предельность конечность мира в пространстве включала геоцентризм Аристотеля и Птоломея и оттеняла космическую функцию Христа. Он как бы замещал исследование причинноследственных связей превращался в важнейший способ восприятия мира и выражения опыта развивал мышление позволяя превращать истины веры в зрительные образы.
24371. Формирование идеалов (математизированное и опытное, экспериментальное знание) науки Нового времени (Г. Галилей, Ф. Бэкон, Р. Декарт) 127 KB
  это время становления новой современной науки. Этому способствовали как внутренние изменения самой науки уже Коперник и Кеплер свою гелиоцентрическую картину мира обосновывают с помощью математического расчета. Давление воды на лопатку движение деталей насоса кузнечного молота шелкопрядильной машины включали в себя непрерывную цепь механических причин и следствий ставших основой механической картины мира классического идеала науки.
24372. Формирование и соотношение естественных, технических и социально-гуманитарных наук: сходство и различия 106 KB
  Лпркшпрожю Развитие технических наук стимулирует развитие естествознания их взаимосвязь не прервалась и после выделения технической науки в отдельную область знания. В то же время существует большой разрыв между действительным применением результатов технической науки на практике и занятием самой этой наукой. С методологической точки зрения исследование в технической науке не сильно отличается от естественнонаучного исследования. Таким образом в научнотехнических дисциплинах необходимо четко различать исследования включенные в инженерную...
24373. Многообразие типов научного знания. Сущность и структура эмпирического знания 55 KB
  Материализация и первичное обобщение данных отражения в форме знания на основе правил соответствия узнавание сравнение измерение описание образуют эмпирические факты эмпирические объекты эмпирическую информацию. Эмпирические факты условно можно разделить на два вида: а факты в основание которых лежат не зависящие от субъекта явления например природные процессы и б факты созданные человеком например экономика экономические отношения. Эмпирические факты обладают большей степенью общности чем единичные данные но меньшей чем...
24374. Сущность и структура теоретического знания 52.5 KB
  Теория это высшая самая развитая форма организации научного знания дающая целостное представление о закономерностях и существенных связях определенное области действительности объекта данной теории 77. С помощью этих знаковых образований языка теории возникает возможность более точно и глубоко судить о соответствующей изучаемой предметной области. Кроме того тот или иной вид теории определяется предметом и задачами исследования глубиной раскрытия сущности предметов и др. Также имеют место попытки поиска идеальной схемы...
24375. Основания науки: нормы и идеалы науки, роль философских идей и принципов в обосновании научного знания (законы и категории) 116.5 KB
  Среди идеалов и норм можно выделить два взаимосвязанных блока: а собственно познавательные установки которые регулируют процесс воспроизведения в различных формах научного знания; б социальные нормативы фиксируют роль науки и ее ценность для общественной жизни на определенном этапе исторического развития. Существует еще и такое мнение что в период нормального эволюционного периода развития науки возможно бессознательное использование многих научных идеалов и норм. Закон единства и борьбы противоположностей является ядром диалектики...
24376. Понятие научной картины мира. Ее исторические формы. Функции научной картины мира (как онтология, форма систематизации знаний, исследовательская программа) 119.5 KB
  Функции научной картины мира как онтология форма систематизации знаний исследовательская программа По Радугину стр. 93 Становление понятия научной картины мира Вопрос о существовании научной картины мира и ее месте и роли в структуре научного знания впервые был поставлен и в определенной степени разработан выдающимися ученымиестествоиспытателями М.Планк в рамках обсуждения проблемы онтологических оснований научного знания поставил вопрос о существовании научной картины мира.
24377. Понятие метода. Классификация методов – эмпирические и теоретические методы познания 66 KB
  Классификация методов – эмпирические и теоретические методы познания По Радугину стр. Как стороны единого процесса познания чувственное и логическое характеризуют любое познание непосредственное отношение субъекта к объекту особенности индивидуальной познавательной деятельности. Оно относится к научному познанию и связано с анализом методов и форм познания на различных уровнях научного исследования характеризуют типы исследований. Задача теоретического уровня познания состоит в познании сущности явлений их законов.