71714

Предварительная обработка статистических данных

Лабораторная работа

Социология, социальная работа и статистика

Предварительная обработка статистических данный включает в себя: Сортировку данных по величине представление их в виде вариационного ряда; Вычисление основных числовых характеристик выборки: выборочного среднего выборочной дисперсии исправленной выборочной дисперсии и дополнительных...

Русский

2014-11-11

111 KB

18 чел.

Лабораторная работа №1  по математической статистике .

«Предварительная обработка статистических данных».

Предварительная обработка статистических данный включает  в себя:

  1.  Сортировку данных по величине, представление их в виде вариационного ряда;
  2.  Вычисление основных числовых характеристик выборки: выборочного среднего , выборочной дисперсии , «исправленной» выборочной дисперсии  и дополнительных коэффициентов выборки: асимметрии и эксцесса.
  3.  Группировка статистических данных, построение гистограммы относительных частот.

Разберем этапы этой процедуры на примере следующей выборки из генеральной совокупности с непрерывным распределением признака  (данные являются целочисленными за счет подходяще выбранной единице измерения).

6, 5, 8, 10, 7, 2, 11, 7, 2, 6, 5, 7,,

5, 9, 8, 5, 6, 5, 5, 8, 6, 7, 4, 6, 3,

3, 10, 1, 10, 4, 10, 5, 8, 4, 5, 5, 1, 9,

8, 13, 4, 8, 13, 1, 7, 5, 6, 0, 4, 3.

Сортируя эти данные по величине, и располагая их в порядке возрастания, получим вариационный ряд:

0, 1, 1, 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 9, 9, 10, 10, 10, 10, 11, 13, 13.

Представим эти данные в виде статистического ряда:

0

1

2

3

4

5

6

7

8

9

10

11

13

1

3

2

3

5

10

6

5

6

2

4

1

2

50

Для вычисления числовых характеристик этого статистического ряда составим таблицу 1(для облегчения расчетов можно переходить к «условным» вариантам  по формуле , где в качестве а выбирается наиболее часто встречающаяся варианта, а b=1 если варианты равноотстоящие и отличаются друг от друга на 1).

 

Используемые формулы:

, где n – объем выборки.

,

, где ,  - среднее квадратичное отклонение;

, где , - среднее квадратичное отклонение;

Таблица 1

Проведем группировку статистических данных.  Учитывая , что n=50<100, найдем число интервалов по формуле: .

N=7.

Т. к. размах выборки W==13-0=13, то ширина интервалов группировки равна h=, а группированный статистический ряд имеет вид:

4

5

15

11

8

5

2

2,15

2,69

8,07

5,92

4,3

2,69

1,07

Гистограмма выборки представлена на рисунке:

Вид этой гистограммы напоминает фигуру под графиком плотности нормального распределения, следовательно, можно выдвинуть (для последующей проверки) гипотезу  о том, что в генеральной совокупности признак распределен по нормальному закону, это означает, что плотность распределения вероятностей признака в генеральной совокупности имеет вид: , .