20784

Показатели вариации

Лекция

Социология, социальная работа и статистика

Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Средняя величина это абстрактная обобщающая характеристика признака изучаемой совокупности но она не показывает строения совокупности которое весьма существенно для ее познания. Средняя величина не дает представления о том как отдельные значения изучаемого признака группируются вокруг средней сосредоточены ли они вблизи или значительно отклоняются от нее. В некоторых случаях отдельные значения признака близко...

Русский

2013-08-01

930.28 KB

3 чел.

Лекция №6

Показатели вариации.

Различие индивидуальных значений признака внутри изучаемой  совокупности в статистике называется вариацией признака.

Она возникает в результате того,  что его индивидуальные значения складываются под  совокупным влиянием разнообразных факторов,  которые по-разному сочетаются в каждом отдельном случае.

Средняя величина    это  абстрактная,  обобщающая характеристика признака изучаемой совокупности,  но она не показывает строения  совокупности, которое весьма существенно для ее познания. Средняя величина не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены ли они вблизи или значительно отклоняются от нее.  В  некоторых  случаях  отдельные  значения признака близко примыкают к средней арифметической и мало от нее отличаются. В таких случаях средняя хорошо представляет всю  совокупность.

В других,  наоборот, отдельные значения совокупности далеко отстают от средней, и средняя плохо представляет всю совокупность.

Колеблемость отдельных значений характеризуют показатели вариации.

Термин "вариация" произошел от латинского variatio –“изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией. Под вариацией в статистике понимают такие количественные  изменения величины  исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Различают вариацию признака: случайную и систематическую.

Анализ систематической вариации позволяет оценить степень зависимости изменений в изучаемом признаке от определяющих ее факторов. Например, изучая силу и характер вариации в выделяемой совокупности, можно оценить,  насколько однородной является данная совокупность в количественном, а иногда и качественном отношении,  а следовательно,  насколько характерной является исчисленная средняя величина. Степень близости данных отдельных единиц хi к средней измеряется  рядом  абсолютных, средних и относительных показателей.


Абсолютные и средние показатели вариации

и способы их расчета.

Для характеристики  совокупностей  и  исчисленных  величин  важно знать, какая вариация изучаемого признака скрывается за средним.

Для характеристики колеблемости признака используется ряд показателей. Наиболее простой из них - размах вариации.

Размах вариации - это разность между наибольшим () и  наименьшим () значениями вариантов.

Пример 1.

Таблица 6.1

Группы предприятий по объему товарооборота, млн.руб.

Число предприятий

90 —

100 —

110 —

120 —

ИТОГО

100

Определяем показатель размаха вариации:

R = 130 - 90 = 40 млн. руб.

Этот показатель улавливает только крайние отклонения и не отражает отклонений всех вариант в ряду.

Чтобы дать обобщающую характеристику распределению  отклонений, исчисляют среднее  линейное  отклонение d,  которое учитывает различие всех единиц изучаемой совокупности.

Среднее линейное отклонение определяется как средняя арифметическая из отклонений индивидуальных значений от средней,  без учета знака этих отклонений:

.

Порядок расчета среднего линейного отклонения следующий:

1) по значениям признака исчисляется средняя арифметическая:

;

2) определяются отклонения каждой варианты  от средней ;

3) рассчитывается сумма абсолютных величин отклонений: ;

4) сумма абсолютных величин отклонений делится на число значений:

.

Пример 2.

Таблица 6.2

Табельный номер рабочего

//

1

2

- 8

8

2

3

- 7

7

3

12

2

4

15

5

5

18

8

Итого

50

30

 

d==

Если данные наблюдения представлены в виде дискретного ряда распределения с частотами, среднее линейное отклонение исчисляется по формуле средней арифметической взвешенной:

Порядок расчета среднего линейного отклонения взвешенного следующий:

1) вычисляется средняя арифметическая взвешенная:

;

2) определяются абсолютные отклонения вариант от средней //;

3) полученные отклонения умножаются на частоты ;

4) находится сумма взвешенных отклонений без учета знака:

;

5) сумма взвешенных отклонений делится на сумму частот:

.

Расчет дисперсии и среднего квадратического отклонения по индивидуальным данным

и в рядах распределения.

Основными обобщающими показателями вариации в статистике являются дисперсии и среднее квадратическое отклонение.

Дисперсия -  это средняя арифметическая квадратов отклонений каждого значения признака от общей средней.  Дисперсия обычно  называется средним квадратом  отклонений и обозначается .  В зависимости от исходных данных дисперсия может вычисляться  по  средней  арифметической простой или взвешенной:

—дисперсия невзвешенная (простая);

—дисперсия взвешенная.

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии и обозначается S:

—среднее квадратическое отклонение невзвешенное;

—среднее квадратическое отклонение взвешенное.

Среднее квадратическое отклонение - это обобщающая характеристика абсолютных размеров вариации признака в совокупности. Выражается оно в тех же единицах измерения, что и признак (в метрах, тоннах, процентах, гектарах и т.д.).

Среднее квадратическое  отклонение  является  мерилом  надежности средней. Чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю представляемую совокупность.

Вычислению среднего  квадратического отклонения предшествует расчет дисперсии.

Порядок расчета дисперсии взвешенную:

1) определяют среднюю арифметическую взвешенную

;

2) определяются отклонения вариант от средней ;

3) возводят в квадрат отклонение каждой варианты от средней ;

4) умножают квадраты отклонений на веса (частоты) ;

5) суммируют полученные произведения

;

6) Полученную сумму делят на сумму весов

.

Пример 3.

Таблица 6.3.

Произведено продукции одним рабочим, шт.

( варианта)

Число рабочих,

8

-2

9

10

90

-1

10

11

12

ИТОГО

50

Исчислим среднюю арифметическую взвешенную:

шт.

Значения отклонений от средней и их квадратов представлены в таблице 6.3. Определим дисперсию:

=1,48

Среднее квадратическое отклонение будет равно:

шт.

Если исходные данные представлены в виде интервального ряда распределения, то сначала надо определить дискретное значение признака,  а далее применить тот же метод, что изложен выше.

Пример 4.

Покажем расчет дисперсии для интервального ряда на данных о  распределении посевной площади колхоза по урожайности пшеницы:

Таблица 6.4

Урожайность пшеницы, ц/га

Посевная площадь, га

14 - 16

-3,4

,56

16 - 18

300

-1,4

,96

18 - 20

,6

,36

20 - 22

,6

,76

ИТОГО

1000

Средняя арифметическая равна:

ц с 1га.

Исчислим дисперсию:

Расчет дисперсии по формуле  по индивидуальным данным и в рядах распределения.

Техника вычисления дисперсии сложна, а при больших значениях вариант и частот может быть громоздкой. Расчеты можно упростить, используя свойства дисперсии.

Свойства дисперсии.

  1.   Уменьшение или увеличение весов (частот) варьирующего признака в определенное число раз дисперсии не изменяет.
  2.   Уменьшение или увеличение каждого значения признака на одну  и ту же постоянную величину А дисперсии не изменяет.
  3.   Уменьшение или увеличение каждого значения признака в какое-то число раз  к  соответственно  уменьшает или увеличивает дисперсию в  раз, а среднее квадратическое отклонение - в к раз.
  4.   Дисперсия  признака  относительно произвольной величины всегда больше дисперсии относительно средней арифметической на  квадрат  разности между средней и произвольной величиной: . Если А равна нулю,  то приходим к следующему равенству: , т.е. дисперсия  признака равна разности между средним квадратом значений признака и квадратом средней.

Каждое свойство при расчете дисперсии может быть применено самостоятельно или в сочетании с другими.

Порядок расчета дисперсии простой:

1) определяют среднюю арифметическую ;

2) возводят в квадрат среднюю арифметическую;

3) возводят в квадрат каждую варианту ряда ;

4) находим сумму квадратов вариант ;

5) делят сумму квадратов вариант на их число,  т.е. определяют средний квадрат ;

6) определяют разность между средним квадратом признака и квадратом средней .


Пример 5.

Имеются следующие данные о производительности труда рабочих:

Таблица 6.4

Табельный номер рабочего

Произведено продукции, шт.

1

2

3

4

5

ИТОГО

50

Произведем следующие расчеты:

шт.

 

Пример 6.

Определить дисперсию  в дискретном ряду распределения,  используя табл. 6.5.

Таблица 6.5.

Произведено продукции 1 рабочим, шт. (х)

Число рабочих, n

8

9

10

11

121

1452

12

ИТОГО

50

Получим тот же результат, что в табл. 6.3.


Рассмотрим расчет дисперсии в интервальном ряду распределения.

Порядок расчета дисперсии взвешенной (по формуле ):

  1.  определяют среднюю арифметическую ;
  2.  возводят в квадрат полученную среднюю ;
  3.  возводят в квадрат каждую варианту ряда ;
  4.  умножают квадраты вариант на частоты ;
  5.  суммируют полученные произведения ;
  6.  делят полученную сумму на сумму весов и получают средний квадрат признака ;
  7.  определяют разность между средним значением квадратов и  квадратом средней арифметической, т.е. дисперсию .

Пример 7.

Имеются следующие данные о распределении посевной площади колхоза по урожайности пшеницы:

Таблица 6.6

Урожайность пшеницы, ц/га

Посевная площадь, га

14 - 16

16 - 18

18 - 20

20 - 22

ИТОГО

1000

В подобных примерах прежде всего определяется дискретное значение признака в каждом интервале,  а затем применяется метод расчета,  указанный выше:

Средняя величина отражает  тенденцию  развития,  т.е.  действие главных причин.  Среднее  квадратическое отклонение измеряет силу воздействия прочих факторов.

Показатели относительного рассеивания.

Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах.  Они позволяют сравнивать характер рассеивания в различных распределениях  (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних,  при сравнении  разноименных  совокупностей). Расчет  показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к  средней  арифметической, умножаемое на 100%.

. Коэффициент  осцилляции  отражает  относительную  колеблемость крайних значений признака вокруг средней.

 (1)

2. Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины.

  (2)

. Коэффициент вариации.

  (3)

Учитывая, что среднеквадратическое отклонение дает обобщающую характеристику колеблемости всех вариантов совокупности, коэффициент вариации является  наиболее  распространенным  показателем колеблемости, используемым для оценки типичности средних величин.  При этом  исходят из того, что если V больше 40 %, то это говорит о большой колеблемости признака в изучаемой совокупности.


Продолжение контрольной работы №1.

Для характеристики производственного стажа  работников  одной  из отраслей промышленности проведено обследование различных категорий работников. Результаты обследования систематизированы в виде таблицы.

По данным таблицы 6.7 определите:

  1.  размах вариации;
  2.  среднее линейное отклонение;
  3.  дисперсию (двумя способами);
  4.  среднее квадратическое отклонение;
  5.  коэффициент вариации стажа рабочих, мастеров, технологов.

Таблица 6.7

Группы работников по стажу работы, лет

Удельный вес работников по стажу в % к итогу

Рабочие

Мастера

Технологи

До 2

7

2 - 4

4 - 6

6 - 8

8 - 10

10 - 12

12 - 14

Свыше 14

8

11

5

Для расчета выберете две любые группы.

12


 

А также другие работы, которые могут Вас заинтересовать

603. Программная оболочка Norton Commander. Назначение и возможности сервисной программы оболочки Norton Commander 69.5 KB
  Программная оболочка Norton Commander и основные функции. Основные функциональные клавиши Norton Commander. Копирование файлов и каталогов. Переименование файлов и каталогов. Удаление файлов и каталогов Поиск файлов на диске. Структура файла nc.ext и его редактирование.
604. Обработка текстовых электронных документов. Подготовка документов на ПЭВМ 72.5 KB
  Классификация документов. Виды и структура текстовых документов, принятых в делопроизводстве органов внутренних дел. Текстовые и графические редакторы ПЭВМ.
605. Особенности ценовой политики фирмы 70.5 KB
  Понятие ценовой политики в системе маркетинга. Ценовая политика является неотъемлемой частью стратегии маркетинга и представляет собой систему принципов и методов управления деятельностью по установлению цен в процессе достижения целей предприятия на рынке.
606. Процесса адиабатного истечения газа через суживающееся сопло 75.5 KB
  Снять опытные характеристики процесса истечения при различных давлениях газа за сопловым каналом. Провести обработку экспериментальных данных и определить области докритического и критического истечения. Построить опытную и теоретическую характеристики суживающегося сопла в координатах.
607. Основные принципы антидотной терапии 68 KB
  Противоядия, действие которых основано на физических процессах (активированный уголь и другие сорбенты). Противоядия, образующие в организме соединения, обладающие особенно высоким средством к яду (амилнитрит, метиленовый спирт и др.)
608. Исследование показателей надежности и рисков нерезервированной технической системы 93 KB
  Определить показатели надежности и риск нерезервированной технической системы. Исследовать функцию риска: представить функцию риска в виде таблицы и графика. Дать качественный и количественный анализ соотношения риска, вычисленного по точной и приближенной зависимостям в MathCAD или табличном процессоре Microsoft Excel.
609. Изучение и освоение практики работы с управленческими корпоративными информационными системами на примере системы Галактика 70 KB
  В работах требуется смоделировать наиболее распространенную в экономической практике ситуацию – а именно: сформировать ряд взаимосвязанных операционных и сводных отчетных документов, отражающих бизнес-процессы и результаты сделок предприятия с контрагентами по покупке и продаже товаров.
610. Однофакторные регрессионные модели 339 KB
  Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации. Оценить статистическую значимость параметров регрессии и корреляции с помощью критерия Фишера и Стьюдента.
611. Маркеры доступа 71.5 KB
  В результате данной работы были изучены основные возможности мониторинга и управления маркерами доступа Windows. Так же были получены навыки реализации взаимодействия созданной программы с процессами и их настройками безопасности.