17182
СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ
Лекция
Социология, социальная работа и статистика
Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ. Задачи сводки и ее содержание Статистическая сводка это научно организованная обработка материалов статистического наблюдения. Цель сводки получение на основе сведенных материалов обобщающих статистических ...
Русский
2013-06-30
97 KB
13 чел.
Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ.
Задачи сводки и ее содержание
Статистическая сводка - это научно организованная обработка материалов статистического наблюдения. Цель сводки - получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально-экономических явлений.
Статистические сводки различаются по ряду признаков:
Таким образом, статистическая сводка это систематизация и группировка цифровых данных, характеристику образованных групп, системой показателей, подсчет соответствующих итогов и представление результатов сводки в виде таблиц, графиков.
Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической печати.
Метод группировки
Исходная информация на стадии сводки систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется статистическая группировка.
Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку.
Особым видом группировки является классификация. Она основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов).
Отличительные черты классификации:
То есть классификация это узаконенная, общепризнанная, нормативная группировка. Классификация является основой группировок.
Метод группировки основан на двух категориях - группировочном признаке и интервале.
Классификация группировочных признаков
По форме выражения |
атрибутивные, не имеющие количественного выражения (профессия, образование); количественные: 1) дискретные (прерывные), значения которых выражаются только целыми числами (количество комнат, детей); 2) непрерывные, значения, которые могут быть как целые, так и дробные. |
По характеру колеблемости |
альтернативные, которыми одни единицы обладают, а другие нет (качество); имеющие множество количественных значений |
По роли признака во взаимосвязи изучаемых явлений |
факторные, воздействуют на другие признаки; результативные, испытывающие на себе влияние других |
Для нахождения числа групп служит формула Стерджесса
п = 1 + 3,322 lg N ,
где N -количество элементов совокупности.
Согласно этой формуле, выбор числа групп зависит от объема совокупности.
Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основу группировки, близко к нормальному.
Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения ( ). Он рассчитывается
где - среднее значение признака по совокупности, которое определяется по формуле;
Если величина интервала равна 0,5 , то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3 и , то совокупность делится соответственно на 9 и 6 групп.
Если делится на 6 групп, то получаются следующие интервалы:
от 3 до - 2
-2 до -
- до
до +
+ до + 2
+ 2 до + 3
Эти методы не дают гарантии в том, что не будут сформированы «пустые» или малочисленные группы. «Пустыми» считаются группы, в которые не попала ни одна единица совокупности. Наличие таких интервалов свидетельствует о том, что группировка построена неправильно.
После определения числа групп следует определить интервалы группировки.
Интервал - представляет собой промежуток между максимальным и минимальным значениями признака в группе.
Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.
Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.
Хмах - Хmin
h = ---------------- ;
п
Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения.
Полученную по формуле величину округляют. Она является шагом интервала.
Существуют следующие правила определения шага интервала.
Если величина интервала представляет собой величину, имеющую один знак до запятой (н-р, 0,66; 1,372; 5,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. ( 0,7; 1,4; 5,8).
Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до
Например, Х max = 180, Х min = 80, п= 5.
h = ( Хмах - Хmin) / п;
h = (180 - 80) / 5 = 20;
Следовательно получили следующие интервалы
80-100; 100-120; 120-140; 140-160; 160-180.
б) неравные, когда ширина интервала постепенно увеличивается, а верхний интервал часто незакрыт вовсе. Неравные интервалы в экономической практике используются чаще.
в) открытые, когда имеется только либо верхняя, либо нижняя граница. Необходимость в открытых интервалах обусловлена, разбросом его количественных значений, требующих образования множества групп, если отделять их обеими границами.
г) закрытые, когда есть и нижняя и верхняя граница. Если неделимые единицы, чел., то 1-3, 4-7, 8-11. При непрерывном изменении признака одно и то же число служит верхней и нижней границами двух смежных групп (90-120, 120-150, 150-180).
При таком построении интервалов вопрос об отнесении единиц объекта наблюдения по группам в практике решается двояко: по принципу «включительно» и «исключительно».
Применение зависит от формы написания интервалов, особенно первой и последней групп.
До 90
90-120
120-150
150-180
В практике встречаются оба, но предпочтение отдается принципу «исключительно».
Серединное значение интервалов определяется несколькими приемами.
Виды статистических группировок
Типологические группировки широко применяются в исследовании социально-экономических явлений и процессов.
Таблица
Группировка по формам собственности в 1998 г.
Группы предприятий по формам собственности |
Число предприятий |
|
всего, единиц |
% к итогу |
|
Федеральная собственность |
26326 |
93,6 |
Муниципальная собственность |
89 |
0,3 |
Частная собственность |
1366 |
4,9 |
Смешанная собственность |
331 |
1,2 |
Всего: |
28112 |
100 |
Таблица
Группировка населения России по месту проживания
за 1959-1994 гг.
Группа населения по месту жительства |
Численность населения |
|||
1959 |
1994 |
|||
Всего, млн.чел. |
в % к итогу |
Всего, млн.чел. |
в % к итогу |
|
Городское |
61,6 |
52 |
108,5 |
73 |
Сельское |
55,9 |
48 |
39,9 |
27 |
Всего: |
117,5 |
100 |
148,4 |
100 |
Таблица
Группировка коммерческих банков России по сумме активов баланса
Группа банков по сумме активов баланса, млн. руб. |
Количество банков, единиц |
В среднем на один банк |
|
численность занятых, чел. |
Балансовая прибыль, млрд.руб. |
||
до 20000 |
19 |
184 |
22,5 |
20000-30000 |
8 |
313 |
31,6 |
30000-40000 |
7 |
374 |
36,0 |
40000-50000 |
9 |
468 |
69,2 |
50000 и более |
7 |
516 |
205,6 |
Всего: |
50 |
323 |
60,0 |
В зависимости от числа положенных в их основание признаков делят на:
Простая - это группировка, выполненная по одному признаку.
Сложная группировка производится по двум и более признакам
Вторичная группировка
Вторичной группировкой называется перегруппировка уже сгруппированного материала.
К ней прибегают:
Статистические ряды распределения
Среди простых группировок особо выделяют ряды распределения.
Ряды распределения представляют собой упорядочное расположение единиц изучаемой совокупности на группы по группировочному признаку.
Ряды распределения, образованные по качественным признакам называют атрибутивными.
При группировке ряда по количественному признаку получаются вариационные ряды.
Вариационные ряды бывают дискретные (прерывные) и интервальные (непрерывные).
Вариационные ряды состоят из двух элементов: варианты и частоты.
Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.
Частота это численность отдельных вариант или каждой группы вариационного ряда.
Частоты, выраженные в долях единицы или в % к итогу, называютсячастостями. Сумма частот составляет объем ряда распределения.
Например, по атрибутивному признаку.
Распределение продавцов магазина по категориям
Группы продавцов по категориям |
Число продавцов, чел. |
В % к итогу |
1 |
50 |
25 |
2 |
100 |
50 |
3 |
50 |
25 |
Итого: |
200 |
100 |
Например, дискретный ряд.
Оценки |
Количество студентов |
В % к итогу |
2 |
1 |
5 |
3 |
2 |
10 |
4 |
10 |
50 |
5 |
7 |
35 |
Итого: |
20 |
100 |
Характер распределения в дискретных рядах изображается графически в виде полигона распределения.
Пример интервального ряда.
Распределение рабочих по выработке
Выработка, т.р. |
Число рабочих |
Кумулятивная(накопленная) численность |
80-100 |
5 |
5 |
100-120 |
10 |
15(5+10) |
120-140 |
20 |
35 ( 15+20) |
140-160 |
10 |
45 (35+10) |
160-180 |
5 |
50 (45+5) |
Итого: |
50 |
Интервальный ряд распределения графически изображается в виде гистограммы.
В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.
Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака ( или концы интервалов), а на оси ординат - нарастающие итоги частот (кумулята) или частостей (огива), соответствующих этим значениям признака.
Одним из важнейших требований, предъявляемых к статистическим рядам распределения, является обеспечение сравнимости их во времени и пространстве. Вариационные ряды с равными интервалами обеспечивают это условие.
Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения, т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.
Группы магазинов по размеру товарооборота, т.р. |
Число магазинов |
Величина интервала, т.р. |
Плотность распределения, ед. (1:2) |
А |
1 |
2 |
3 |
До 50 |
25 |
50 |
0,5 |
50-120 |
45 |
70 |
0,64 |
120-250 |
65 |
130 |
0,5 |
250-450 |
80 |
200 |
0,4 |
450-980 |
20 |
530 |
0,04 |
Итого: |
235 |
Сравнение частот отдельных групп показывает, что чаще всего встречаются магазины с интервалом 250450 т.р.
При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.
Статистические таблицы
Результаты сводки и группировки материалов наблюдений представляют в виде статистических таблиц. Они позволяют изложить материал наиболее удобно, компактно, наглядно и рационально.
В статистических таблицах различают подлежащее и сказуемое. Подлежащим -является тот объект, о котором идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым в таблице называют показатели, с помощью которых изучается объект, т.е. подлежащее.
Статистические таблицы могут быть простыми и сложными.
К простым относятся перечневые таблицы, в которых подлежащим служит перечень отдельных объектов.
В сложных таблицах подлежащее представляет собой совокупность, расчлененную на группы по одному или нескольким признакам.
Таблицы, в подлежащем которых имеет место группировка по одному признаку, именуют групповыми.
При наличии в подлежащем группировки по двум и более признакам таблица именуется комбинационной.
К числу сложных таблиц относят и корреляционные и балансовые таблицы.
Деление таблиц на простые, групповые и комбинационные основано на степени расчленения подлежащего. Однако и сказуемое может быть представлено по-разному.
Если все показатели сказуемого характеризуют подлежащее отдельно, независимо друг от друга, то такая разработка сказуемого называется простой. Если же в сказуемом один признак комбинируется с другим, то такая разработка сказуемого называется сложной.
Впервые статистические таблицы были применены при изложении статистических данных в 1727 г. в России И.К. Кириловым в работе «Цветущее состояние Всероссийского государства»
Применение комбинационных таблиц относятся к более позднему периоду (1882).
К техническим моментам при составлении таблиц относятся:
а) «х» - клетка вообще не подлежит заполнению;
б) «...» - отсутствуют сведения;
в) «-» - отсутствует само явление;
г) 0,0 - то при округлении с большей точностью может появиться значащая цифра.
Статистические графики
Статистический график - это чертеж, на котором при помощи условных геометрических фигур (линий, точек, символов) изображаются статистические данные.
Основоположником графического метода в статистике считают английского экономиста У.Плейфейра (1731-1798 г.) . В его работе «Коммерческий и политический атлас» (1786г.) впервые были применены способы графического изображения статистических данных (линейные, столбиковые, секторные и др.диаграммы).
Основные элементы графика включают в себя:
Классификация статистических графиков. По способу построения графики делятся на диаграммы, картограммы, картодиаграммы.
Линейные диаграммы Для них применяется система прямоугольных координат. Достоинства в том, что на одном и том же графике можно изобразить несколько показателей, что важно для сравнения.
Столбиковые диаграммы Используется прямоугольная система координат. При этом каждое значение изучаемого показателя изображается в виде вертикального столбика. Основание выбирается произвольно, а высота соответствует изображаемым данным. Расстояние между столбиками должно быть одинаковым. Уровни показателя изображаются внутри столбика.
Ленточные (полосовые) графики Основания столбиков располагаются вертикально, а масштабная линейка наносится на горизонтальную ось. Применяется в практике для систематического отображения хода выполнения производственных заданий нарастающих итогом.
Круговые диаграммы. В них площадь окружности принимается за величину всей изучаемой совокупности, а площади отдельных секторов отображают удельный вес (долю) ее составных частей. 1% = 3,6°.
Радиальная диаграмма. Строится на базе полярных координат. Началом отсчета в них служит центр окружности, а носителями масштабных шкал являются радиусы круга. Обычно в основе радиальных диаграмм лежат повторяющиеся годовые циклы с помесячным или поквартальными данными. Например, годовой цикл ( : ) на 12 частей. На каждом радиусе в соответствии с установленным масштабом наносятся точки, соответствующие изучаемым за каждый месяц данным. Полученные таким образом точки, соединяют между собой линиями. В результате получается спиралеобразная линия, характеризующая внутригодовые циклы.
Фигурные диаграммы. Данные изображаются рисунками - символами, которые в наибольшей степени соответствуют существу отображаемых явлений. Применяют для рекламы. В них каждому знаку-символу условно придается определенное числовое значение, и путем последовательного их расположения на поле графика формируются соответствующие полосы. Недостатком является то, что наряду с целыми фигурами приходится иметь дело с их частями.
Знаки Варзара. Русский статистик В.Е.Варзар (1851-1940) предложил использовать прямоугольные фигуры для графического изображения трех показателей, один из которых является произведением двух других. В каждом прямоугольнике сумма прямоугольника равна величине третьего показателя, который равен произведению двух первых.
В настоящее время разработаны пакеты прикладных программ компьютерной графики. Наиболее распространенными пакетами прикладных программ являются: Statgraf , Supercalc, Exel.
А также другие работы, которые могут Вас заинтересовать | |||
19233. | КОЛЕБАНИЯ И ВОЛНЫ В ПЛАЗМЕ | 168.5 KB | |
Колебания и волны в плазме Ввиду наличия заряженной и нейтральной компонент плазма обладает большим числом колебаний и волн некоторые из которых свойственны также газообразным средам а другие присуще исключительно плазме. Наиболее простые колебания заря... | |||
19234. | КОЛЕБАНИЯ И ВОЛНЫ В ЗАМАГНИЧЕННОЙ ПЛАЗМЕ | 119.5 KB | |
КолЕбания и волны в замагниченной плазме Типичным случаем для низкотемпературной и высокотемпературной плазмы является ее расположение во внешнем магнитном поле. Для лабораторной плазмы это специально созданные сильные магнитные поля необходимые для магнитной... | |||
19235. | ПЕРЕНОСЫ В ЗАМАГНИЧЕННОЙ ПЛАЗМЕ | 110.5 KB | |
Переносы в замагниченной плазме В начале работ по управляемому термоядерному синтезу возникла проблема предохранения стенок камеры от высокотемпературной плазмы известным решением которой явился принцип магнитной термоизоляции плазмы. Огромное значение д | |||
19236. | УСТОЙЧИВОСТЬ ПЛАЗМЫ | 98.5 KB | |
Устойчивость плазмы Вопросы устойчивости плазмы важны для установок содержащих низкотемпературную и высокотемпературную плазму ввиду того что потеря устойчивости может означать разрушение плазмы исчезновение рабочих параметров и т.д. При проблеме управляемого т | |||
19237. | РАДИАЦИОННЫЕ ПОЯСА ЗЕМЛИ | 93.5 KB | |
Радиационные пояса Земли При запуске первых спутников был установлен факт существования радиационных поясов состоящих из заряженных частиц высоких энергий. Данные пояса можно объяснить исходя из представлений о структуре магнитного поля Земли и движении заря | |||
19238. | ТЕРМОЯДЕРНЫЙ СИНТЕЗ | 1.14 MB | |
Лекция № 1. Термоядерный синтез Условие необходимое для термоядерного синтеза. Термоядерные реакции сечения и скорость реакции формула Гамова. Критерий Лоусона. Оценка оптимальной температуры и произведения плотности на время удержания для циклов ДД и ДТ. Тер | |||
19239. | ПУТИ РЕШЕНИЯ ПРОБЛЕМЫ ТЕРМОЯДЕРНОГО СИНТЕЗА | 72 KB | |
Лекция № 2. Пути решения проблемы термоядерного синтеза Основные направления исследований по ядерному синтезу: а системы с магнитным удержанием; б квазистационарные открытые и закрытые; импульсные; в системы с инерциальным удержанием лазерные с различными пучк... | |||
19240. | СИСТЕМЫ ЭНЕРГОСНАБЖЕНИЯ ТЕРМОЯДЕРНЫХ УСТАНОВОК | 731.5 KB | |
Лекция 3 СИСТЕМЫ ЭНЕРГОСНАБЖЕНИЯ ТЕРМОЯДЕРНЫХ УСТАНОВОК Оценка требуемых параметров систем энергоснабжения термоядерных установок. Способы нагрева плазмы: омический или джоулев нагрев плазмы адиабатический нагревинжекция пучков быстрых нейтралов ВЧ методы н | |||
19241. | ТИПЫ ДРЕЙФОВЫХ ДВИЖЕНИЙ ЧАСТИЦ В ПЛАЗМЕ ТЕРМОЯДЕРНЫХ УСТАНОВОК ТИПА ТОКАМАК | 850 KB | |
Лекция № 4. типы дрейфовых движений частиц в плазме термоядерных установок типа токамак Дрейф в неоднородном поле центробежный и градиентный поляризационный дрейф тороидальный дрейф и вращательное преобразование тороидальной магнитной конфигурации Ра... | |||