17182

СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ

Лекция

Социология, социальная работа и статистика

Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ. Задачи сводки и ее содержание Статистическая сводка это научно организованная обработка материалов статистического наблюдения. Цель сводки получение на основе сведенных материалов обобщающих статистических ...

Русский

2013-06-30

97 KB

12 чел.

Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ.

Задачи сводки и ее содержание

Статистическая сводка - это научно организованная обработка материалов статистического наблюдения. Цель сводки - получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально-экономических явлений.

Статистические сводки различаются по ряду признаков:

  1.  По сложности построения сводка может быть простая и сложная. Если представлять общие итоги по изучаемой совокупности в целом без какой-либо предварительной систематизации собранного материала - это простая сводка. Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему и представление результатов группировки и сводки в виде статистических таблиц.
  2.   По способу разработки сводки делятся на централизованные, когда все данные сосредотачиваются в одной организации и сводятся по разработанной методике (используется для обработки материалов единовременных статистических наблюдений). При децентрализованной обобщение материала осуществляется снизу доверху по иерархической лестнице управления, подвергаясь на каждом из них соответствующей обработке (используется для обработки статистической отчетности).
  3.  По технике выполнения сводка подразделяется на механизированную и ручную.

Таким образом, статистическая сводка это систематизация и группировка цифровых данных, характеристику образованных групп, системой показателей, подсчет соответствующих итогов и представление результатов сводки в виде таблиц, графиков.

Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию  в периодической печати.

Метод группировки

Исходная информация на стадии сводки систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется  статистическая группировка.

Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку.

Особым видом группировки является классификация. Она основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов).

Отличительные черты классификации:

  1.  В основу кладется качественный признак.
  2.  Они стандартны.
  3.  Они устойчивы.

То есть классификация это узаконенная, общепризнанная, нормативная группировка. Классификация является основой группировок.

Метод группировки основан на двух категориях - группировочном признаке и интервале.

  1.  Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Они бывают атрибутивные - по качественному признаку и количественные.

Классификация группировочных признаков

По форме выражения

атрибутивные, не имеющие количественного выражения (профессия, образование);

количественные: 1) дискретные (прерывные), значения которых выражаются только целыми числами (количество комнат, детей); 2) непрерывные, значения, которые могут быть как целые, так и дробные.

По характеру колеблемости

альтернативные, которыми одни единицы обладают, а другие нет (качество);

имеющие множество количественных значений

По роли признака во взаимосвязи  изучаемых явлений

факторные, воздействуют на другие признаки;

результативные, испытывающие на себе влияние других

Для нахождения числа групп служит формула Стерджесса

п = 1 + 3,322 lg N ,

где N -количество элементов совокупности.

Согласно этой формуле, выбор числа  групп зависит от объема совокупности.   

Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основу группировки, близко к нормальному.

Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (     ). Он рассчитывается

где       - среднее значение признака по совокупности, которое определяется по формуле;

  •  -е значение варьирующего признака;
  •  среднее квадратическое отклонение.

Если величина интервала равна 0,5    , то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3    и    , то совокупность делится соответственно на 9 и 6 групп.

Если делится на 6 групп, то получаются следующие интервалы:

от                     3        до           - 2

                      -2        до           -

                      -          до             

                                 до           +

                       +        до           + 2

                       + 2     до           + 3

Эти методы не дают гарантии в том, что не будут сформированы «пустые» или малочисленные группы. «Пустыми» считаются группы, в которые не попала ни одна единица совокупности. Наличие таких интервалов свидетельствует о том, что группировка построена неправильно.

После определения числа групп следует определить интервалы  группировки.

Интервал - представляет собой промежуток между максимальным и минимальным значениями признака в группе.

Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.

                            Хмах - Хmin

                     h  = ----------------   ;

                                   п

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения.

Полученную по формуле величину округляют. Она является шагом интервала.

Существуют следующие правила определения шага интервала.

Если величина интервала представляет собой величину, имеющую один знак до запятой (н-р, 0,66; 1,372; 5,8), то полученные значения целесообразно округлить до десятых   и их использовать в качестве шага интервала. ( 0,7; 1,4; 5,8).

Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до

Например, Х max = 180, Х min = 80, п= 5.

                     h =  ( Хмах - Хmin) / п;

h = (180 - 80) / 5  = 20;

Следовательно получили следующие интервалы

80-100; 100-120; 120-140; 140-160; 160-180.

б) неравные, когда ширина интервала постепенно увеличивается, а верхний интервал часто незакрыт вовсе. Неравные интервалы в экономической практике используются чаще.

в) открытые, когда имеется только либо верхняя, либо нижняя граница. Необходимость в открытых интервалах обусловлена, разбросом его количественных значений, требующих образования множества групп, если отделять их обеими границами.

г) закрытые, когда есть и нижняя и верхняя граница. Если неделимые единицы, чел., то 1-3, 4-7, 8-11. При непрерывном изменении признака одно и то же число служит верхней и нижней границами двух смежных групп (90-120, 120-150, 150-180).

При таком построении интервалов вопрос об отнесении единиц объекта наблюдения по группам в практике решается двояко: по принципу «включительно» и «исключительно».

Применение зависит от формы написания интервалов, особенно первой и последней групп.

До 90

90-120

120-150

150-180

  1.  180 и более - исключительно - 180 входит в последний
  2.  свыше 180 - включительно - 180 входит в предыдущий.

В практике встречаются оба, но предпочтение отдается принципу «исключительно».

Серединное значение интервалов определяется несколькими приемами.

  1.  Суммируем верхнюю и нижнюю границу интервала и делим на 2.
  2.  Середина 2-го интервала плюс величина интервала.
  3.  Середина 2-го интервала минус величина интервала (для открытого).
  4.  К середине предпоследнего интервала прибавляем величину интервала (для открытых).

Виды статистических группировок

  1.  Типологическая группировка. Суть: Выделение из множества признаков, характеризующих изучаемые явления, основных типов в качественно однородные. Если атрибутивный признак, то число групп определяется свойствами изучаемого явления. Например, группировка населения по половозрастному признаку, численность по годам, ППП, в том числе рабочие, ученики, ИТР, служащие, МОП. Выделение типов на основе количественного признака состоит в определении групп с учетом значений изучаемых признаков. Пример: ясельный 0-2; дошкольный 3-6; школьный 7-17; трудоспособный 16-54 для женщин и 16-59 для мужчин.

Типологические группировки широко применяются в исследовании социально-экономических явлений и процессов.

Таблица

Группировка по формам собственности в 1998 г.

Группы предприятий по формам собственности

Число предприятий

всего, единиц

% к итогу

Федеральная собственность

26326

93,6

Муниципальная собственность

89

0,3

Частная собственность

1366

4,9

Смешанная собственность

331

1,2

Всего:

28112

100

  1.  Структурная группировка. Это группировки, используемые для изучения строения изучаемой совокупности. В большинстве своем структурные группировки производятся на основе образования качественно однородных групп. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания, состав предприятий по численности занятых,   стоимости основных фондов.

Таблица

Группировка населения России по месту проживания

за 1959-1994 гг.

Группа населения по месту жительства

Численность населения

1959

1994

Всего, млн.чел.

в % к итогу

Всего, млн.чел.

в % к итогу

Городское

61,6

52

108,5

73

Сельское

55,9

48

39,9

27

Всего:

117,5

100

148,4

100

  1.  Аналитическая группировка(факторная). Она используется для изучения связи между отдельными признаками. Например, между стажем работы и квалификацией, разрядом рабочего и образованием. Особенности аналитической группировки: во-первых, в основу кладется факторный признак; во-вторых, каждая выделенная группа характеризуется средними значениями результативного признака.

Таблица

Группировка коммерческих банков России по сумме активов баланса

Группа банков по сумме активов баланса, млн. руб.

Количество банков, единиц

В среднем на один банк

численность занятых, чел.

Балансовая прибыль, млрд.руб.

до 20000

19

184

22,5

20000-30000

8

313

31,6

30000-40000

7

374

36,0

40000-50000

9

468

69,2

50000 и более

7

516

205,6

Всего:

50

323

60,0

  1.  Комбинированная группировка. Это образование групп по двум и более признакам, взятым в определенном сочетании. При этом атрибутивные признаки располагаются вначале в определенной последовательности, исходя из логики взаимосвязи показателей. Пример, образованы группы по формам хозяйствования они разделены на подгруппы по уровню рентабельности или по производительности труда, фондоотдачи.

В зависимости от числа положенных в их основание признаков делят на:

Простая - это группировка, выполненная по одному признаку.

Сложная группировка производится по двум и более признакам

Вторичная группировка

Вторичной группировкой называется перегруппировка уже сгруппированного материала.

К ней прибегают:

  1.   Когда из большого числа первоначально образованных групп надо получить меньшее число более крупных.
  2.   Когда в целях сравнения нужно привести в сопоставимый вид по-разному сгруппированный материал.

Статистические ряды распределения

Среди простых группировок особо выделяют ряды распределения.

Ряды распределения   представляют собой упорядочное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Ряды распределения, образованные по качественным признакам называют атрибутивными.

При группировке ряда по количественному признаку получаются вариационные ряды.

Вариационные ряды бывают дискретные (прерывные) и интервальные (непрерывные).

Вариационные ряды состоят из двух элементов: варианты и частоты.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота это численность отдельных вариант или каждой группы вариационного ряда.

Частоты, выраженные в долях единицы или в % к итогу, называютсячастостями. Сумма частот составляет объем ряда распределения.

Например, по атрибутивному признаку.

Распределение продавцов магазина по категориям

Группы продавцов по категориям

Число продавцов, чел.

В % к итогу

1

50

25

2

100

50

3

50

25

Итого:

200

100

Например, дискретный ряд.

Оценки

Количество студентов

В % к итогу

2

1

5

3

2

10

4

10

50

5

7

35

Итого:

20

100

 

Характер распределения в дискретных рядах изображается графически в виде полигона распределения.

Пример интервального ряда.

Распределение рабочих по выработке

Выработка, т.р.

Число рабочих

Кумулятивная(накопленная) численность

80-100

5

5

100-120

10

15(5+10)

120-140

20

 35 ( 15+20)

140-160

10

45 (35+10)

160-180

5

50 (45+5)

Итого:

50

Интервальный ряд распределения графически изображается в виде гистограммы.

В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.

Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются  кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака ( или концы интервалов), а на оси ординат - нарастающие итоги частот (кумулята) или частостей (огива), соответствующих этим значениям признака.

Одним из важнейших требований, предъявляемых к статистическим рядам распределения, является обеспечение сравнимости их во времени и пространстве. Вариационные ряды с равными интервалами обеспечивают это условие.

Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения, т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.

Группы магазинов по размеру товарооборота, т.р.

Число магазинов

Величина интервала, т.р.

Плотность распределения, ед. (1:2)

А

1

2

3

До 50

25

50

0,5

50-120

45

70

0,64

120-250

65

130

0,5

250-450

80

200

0,4

450-980

20

530

0,04

Итого:

235

 

Сравнение частот отдельных групп показывает, что чаще всего встречаются магазины с интервалом 250—450 т.р.

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

Статистические таблицы

Результаты сводки и группировки материалов наблюдений представляют в виде статистических таблиц. Они позволяют изложить материал наиболее удобно, компактно, наглядно и рационально.

В статистических таблицах различают подлежащее  и сказуемое. Подлежащим -является тот объект, о котором идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым в таблице называют показатели, с помощью которых изучается объект, т.е. подлежащее.

Статистические таблицы могут быть простыми и сложными.

К  простым относятся перечневые таблицы, в которых подлежащим служит перечень отдельных объектов.

В  сложных таблицах подлежащее представляет собой совокупность, расчлененную на группы по одному или нескольким признакам.

Таблицы, в подлежащем которых имеет место группировка по одному признаку, именуют   групповыми.

При наличии в подлежащем группировки по двум и более признакам таблица именуется комбинационной.

К числу сложных таблиц относят и корреляционные и балансовые таблицы.

Деление таблиц на простые, групповые и комбинационные основано на степени расчленения подлежащего. Однако и сказуемое может быть представлено по-разному.

Если все показатели сказуемого характеризуют подлежащее отдельно, независимо друг от друга, то такая разработка сказуемого называется простой. Если же в сказуемом один признак комбинируется с другим, то такая разработка сказуемого называется сложной.

Впервые статистические таблицы были применены при изложении статистических данных в 1727 г. в России И.К. Кириловым в работе «Цветущее состояние Всероссийского государства»

Применение комбинационных таблиц относятся к более позднему периоду (1882).

К техническим моментам при составлении таблиц относятся:

  1.   Четкость заголовков.
  2.   Указываются единицы измерения в отдельных графах.
  3.  Повторяющиеся термины выносятся в общие заголовки.
  4.  Графы и строки необходимо нумеровать.
  5.  В групповых и комбинационных таблицах всегда надо давать итоговые графы и строки.
  6.  Округление чисел проводится с одинаковой точностью. Когда одна величина превосходит другую многократно, то полученные показатели динамики лучше выражать не в % , а в разах. Например, вместо 586%, следует в 5,9 раз больше.
  7.  В аналитических таблицах значимость абсолютных цифр должна быть наименьшей. Когда интересами исследования предусмотрены многозначные числа, то начиная справа следует выделять миллионы, тыс.ед. Например, 1458946 р., 1 458 946 р. или можно округлять до 2-3 знаков 1,46 млн.р.
  8.  Когда в таблице наряду с отчетными данными приводятся сведения расчетного порядка, то делаются оговорки в виде сносок.
  9.  При неполном объеме изучаемой совокупности или отсутствии исходных данных все слагаемые сначала показывают в строке « общие итоги», а потом после пояснения в строке «в том числе» перечисляются наиболее важные их составные части.
  10.  Отдельные клетки могут быть не заполнены по следующим причинам:

а) «х» - клетка вообще не подлежит заполнению;

б) «...»  - отсутствуют сведения;

в) «-»  - отсутствует само явление;

г) 0,0  - то при округлении с большей точностью может появиться значащая цифра.

Статистические графики

Статистический график - это чертеж, на котором при помощи условных геометрических фигур (линий, точек, символов) изображаются статистические данные.

Основоположником графического метода в статистике считают английского экономиста У.Плейфейра (1731-1798 г.) . В его работе «Коммерческий и политический атлас» (1786г.) впервые были применены способы графического изображения статистических данных (линейные, столбиковые, секторные и др.диаграммы).

Основные элементы графика включают в себя:

  1.   Поле графика - это место, на котором он выполняется. Принято считать, что наиболее оптимальным для зрительного восприятия является график, выполненный на поле прямоугольной формы с соотношением сторон от 1:1,3 до 1:1,5 (правило «золотого сечения»). Иногда используется и поле в виде квадрата.
  2.  Графический образ - это символические знаки, с помощью которых изображаются статистические данные.
  3.  Пространственные и масштабные ориентиры. Пространственные ориентиры определяют размещение графических образов на поле графика. Они задаются координатной сеткой или контурными линиями. Масштабные ориентиры - придают графическим образам количественную значимость, которая передается с помощью системы масштабных шкал.
  4.  Экспликация графика -это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа.

Классификация статистических графиков. По способу построения графики делятся на диаграммы, картограммы, картодиаграммы.

  1.  Диаграмма представляет чертеж, на котором статистическая информация изображается посредством геометрических фигур или символических знаков.

Линейные диаграммы Для них применяется система прямоугольных координат. Достоинства в том, что на одном и том же графике можно изобразить несколько показателей, что важно для сравнения.

Столбиковые диаграммы Используется прямоугольная система координат. При этом каждое значение изучаемого показателя изображается в виде вертикального столбика. Основание выбирается произвольно, а высота соответствует изображаемым данным. Расстояние между столбиками должно быть одинаковым. Уровни показателя изображаются внутри столбика.

Ленточные (полосовые) графики Основания столбиков располагаются вертикально, а масштабная линейка наносится на горизонтальную ось. Применяется в практике  для систематического отображения хода выполнения производственных заданий нарастающих итогом.

Круговые диаграммы. В них площадь окружности принимается за величину всей изучаемой совокупности, а площади отдельных секторов отображают удельный вес (долю) ее составных частей. 1% = 3,6°.

Радиальная диаграмма. Строится на базе полярных координат. Началом  отсчета в них служит центр окружности, а носителями масштабных шкал являются радиусы круга. Обычно в основе радиальных диаграмм лежат повторяющиеся годовые циклы с помесячным или поквартальными данными. Например, годовой цикл ( : ) на 12 частей. На каждом радиусе в соответствии с установленным масштабом наносятся точки, соответствующие изучаемым за каждый месяц данным. Полученные таким образом точки, соединяют между собой линиями. В результате получается спиралеобразная линия, характеризующая внутригодовые циклы.

Фигурные диаграммы. Данные изображаются рисунками - символами, которые в наибольшей степени соответствуют существу отображаемых явлений. Применяют для рекламы. В них каждому знаку-символу условно придается определенное числовое значение, и путем последовательного их расположения на поле графика формируются соответствующие полосы. Недостатком является то, что наряду с целыми фигурами приходится иметь дело с их частями.

Знаки Варзара. Русский статистик В.Е.Варзар (1851-1940) предложил использовать прямоугольные фигуры для графического изображения трех показателей, один из которых является произведением двух других. В каждом прямоугольнике сумма прямоугольника равна величине третьего показателя, который равен произведению двух первых.

  1.   Картограмма - это схематичная карта или план местности, на которой отдельные территории в зависимости от величины изображаемого показателя обозначаются с помощью графических символов (штриховки, расцветки, точек).
  2.  Картодиаграмма - представляет собой сочетание контурной карты(плана) местности с диаграммой. В отличие от диаграммы используемые геометрические символы располагаются по всей карте.

В настоящее время разработаны пакеты прикладных программ компьютерной графики. Наиболее распространенными пакетами прикладных программ  являются: Statgraf , Supercalc, Exel.


 

А также другие работы, которые могут Вас заинтересовать

69927. КРАТКАЯ ИСТОРИЯ ЗАКОНОДАТЕЛЬСТВА, РЕГЛАМЕНТИРУЮЩЕГО ДЕЯТЕЛЬНОСТЬ МЕДИЦИНСКИХ РАБОТНИКОВ 41 KB
  Элементы правового регулирования медицинской деятельности появились одновременно с зарождением медицины. Но уже появляются отдельные указы посвященные вопросам медицинской деятельности. Большую роль в истории правовой регламентации медицинской деятельности сыграл...
69928. Общие понятия истории культуры 99.5 KB
  Когда в средние века появился новый способ возделывания зерновых, более прогрессивный и усовершенствованный, названный латинским словом culture, никто еще не мог догадаться, насколько изменится и расширится понятие этого выражения. Если термин agriculture и в наше время означает...
69929. Искусственный интеллект: основные понятия и история возникновения 73 KB
  Появление ЭВМ работа которых происходит под управлением созданных человеком программ т. При этом важным является то что а вычислительный процесс должен представляться в виде последовательности сколь угодно большой но конечной длины элементарных или рутинных операций...
69930. Теоретико-методологические проблемы истории социальной работы в России 69 KB
  Социальная работа это вид деятельности людей и организаций по оказанию помощи различным слоям населения. Спектр оказания помощи: человек человеку; община человеку; взрослый ребенку сироте; здоровый больному; служба социальной помощи безработному пенсионеру многодетной семье и т.
69933. Предмет и методы науки истории 41.5 KB
  Предмет и методы науки истории. Методы истории. Важнейшая задача истории обобщение и обработка накопленного человеческого опыта. Ключевский писал: Без знания истории мы должны признать себя случайностями не знающими как и зачем мы пришли в мир как и для чего в нем живем как и к чему...
69934. Предмет и задачи психофизиологии. Принципы психофизиологического исследования 41.5 KB
  Принципы психофизиологического исследования В связи с успехами изучения активности отдельных нейронов мозга животных и в условиях клинического обследования у человека психофизиология стала наукой не только о физиологических но и о нейронных механизмах психических процессов состояний и поведения.
69935. Содержание предпринимательской деятельности в жизни современного общества 233 KB
  Изучить сущность предпринимательской деятельности и ее роль в развитии общества и бизнеса цели предпринимательства условия предпринимательской деятельности. История возникновения и сущность предпринимательства. Виды и формы предпринимательства.