17592

Выборочное наблюдение. Особенности малой выборки

Лекция

Социология, социальная работа и статистика

11 ТЕМА 4 Выборочное наблюдение ПЛАН ЛЕКЦИИ 1. Статистическое наблюдение 2. Выборочное наблюдение причины и условия его применения. 3. Виды и схемы выборки. 4. Ошибки выборки. 5. Определение необходимой численности выборки. 6. Особенности малой вы

Русский

2013-07-05

201 KB

71 чел.

11

ТЕМА 4 Выборочное наблюдение

ПЛАН ЛЕКЦИИ

1. Статистическое наблюдение

2. Выборочное наблюдение, причины и условия его применения.

3. Виды и схемы выборки.

4. Ошибки выборки.

5. Определение необходимой численности выборки.

6. Особенности малой выборки.

1. Статистическое наблюдение

Статистическое наблюдение научно организованный сбор массовых данных о явлениях и процессах, которые происходят в обществе.

План наблюдения предусматривает цель, объект и единицу наблюдения, источники и средства получения данных, время (момент) наблюдения и др. Следует отличать единицу статистического наблюдения от элемента совокупности.

Единица — носитель информации; элемент - носитель признаков. Так, во время переписи оборудования единицей наблюдения является отдельное предприятие, а элементом -отдельный станок или механизм.

Применяют две организационных формы наблюдения - отчетность и специально организованные наблюдения. К последней относятся переписи, одноразовые учеты, выборочные обследования.

По охвату единиц совокупности наблюдения разделяют на сплошное и не сплошное. Последнее бывает нескольких видов: наблюдение основного массива, выборочное, монографическое и анкетное.

При сплошном обследовании регистрации подлежат все без исключения элементы совокупности.

Наблюдение основного массива охватывает преобладающую часть элементов совокупности.

При выборочном наблюдении изучается лишь часть совокупности, отобранная специальным методом, который:

а) обеспечивает равный шанс для каждой единицы совокупности попасть в выборку;

б) определяет достаточное количество отобранных единиц.

Выполнение этих двух условий делает выборку репрезентативной, представительной.

Это дает возможность приписать, распространить характеристики, которые определенные для выборочной совокупности (например, среднее значение), на всю совокупность, которая имеет название генеральной.

Монографическое наблюдение предусматривает детальное описание небольшого количества или отдельных единиц совокупности, которые могут считаться типичными.

Анкетные наблюдения применяются, например, при социологических исследованиях.

И, в конце концов, существуют три способа получения статистических данных: непосредственный учет фактов, документальный учет и опрашивание респондентов.

Расхождения между данными наблюдений и реальными данными называют ошибками наблюдения.

Различают два вида таких ошибок. Ошибки регистрации, которые возникают вследствие неправильного установления фактов или их регистрации. Ошибки репрезентативности присущи только выборочному наблюдению и возникают в результате некорректного формирования выборочной совокупности.

2. Выборочное наблюдение, причины и условия его применения.

Так как статистика имеет дело с массовыми явлениями и процессами, то в ряде случаев их исследование может оказаться довольно трудоемким. Кроме того, отдельные методы контроля или испытаний связанные с разрушением образцов, которые исследуются. Возникает вопрос о замене сплошного наблюдения выборочным. Теория и практика указывают на возможность и целесообразность такой замены.

Выборочное наблюдениенаучно обоснованное средство не сплошного наблюдения, при котором исследуется лишь часть совокупности, отобранная по определенным правилам выборки, что обеспечивает результаты, которые характеризуют всю совокупность в целом.

Совокупность, из которой проводят выбор единиц, называют генеральной, а отобранную часть — выборкой.

Характеристики выборочной совокупности являются оценками соответствующих параметров генеральной совокупности. Но выборка не точно воссоздает генеральную совокупность, и поэтому оценки не совпадают с самыми параметрами. Расхождения между ними называются ошибками репрезентативности. Они бывают систематическими и случайными. Систематические ошибки возникают, если при формировании выборочной совокупности не был соблюденный принцип случайности отбора, который обеспечивает всем элементам генеральной совокупности равные возможности попасть в выборку. Систематические ошибки для всех элементов совокупности имеют одностороннее направление и поэтому их называют ошибками смещения. В отличие от них, ошибки, которые неминуемо возникают и при соблюдении принципа случайности отбора, но не носят тенденциозного характера, имеют название случайных и не ведут к смещению оценок.

При проведении выборочного обследования важно избегнуть систематических ошибок; присущих выборочному наблюдению; случайные ошибки неизбежны, тем не менее, теория дает возможность с определенной вероятностью определить их границы.

Выборка будет репрезентативной не только тогда, когда каждая единица будет иметь одинаковый шанс попасть в нее, а и если объем ее есть достаточным.

3. Виды и схемы выборки.

Существуют разные виды и схемы выборки, их особенности влияют на размер ошибки и методы ее вычисления.

Различают такие виды выборки.

Простой случайный отбор осуществляют с помощью жребия или таблиц случайных чисел. Требует для своего проведения тщательной подготовки.

Систематический (механический) отбор предусматривает представление всей совокупности в виде списка, упорядоченного по некоторой нейтральной единицей. Выбор элементов осуществляется через равные интервалы. Так, если необходимо провести  10-процентную выборку студентов, то составляется список фамилий по алфавиту и механически отбирается любой десятый студент. Начальный элемент выбирают как случайное число из первого интервала, например 6. Тогда выбираем элементы: 6, 16, 26, и т.д. Можно сказать, что этот метод представляет собой разновидность предшествующего, но его легче организовать.

Типический (расслоенный) отбор ориентирован на обеспечение представительства в выборке соответствующих типичных групп генеральной совокупности. При этом вся совокупность разбивается (расчленяется) на однотипные, однородные группы. Потом из каждой группы по одному из указанных выше методов отбирается количество единиц, пропорциональных удельному весу группы в общей совокупности.

Серийный отбор состоит в том, что отбираются не отдельные единицы, а целые группы (серии, гнезда), отобранные случайным или механическим методом. В каждой такой группе проводят сплошное обследование, а результаты распространяют на всю совокупность. Такой способ отбора применяют, например, при проверке качества продукции того или иного цеха (предприятия).

Применение того или иного способа формирования выборочной совокупности зависит от цели выборочного обследования, условий его организации и проведения. Наиболее распространенными являются комбинированные выборки.

Схемы отбора бывают такими.

Повторный отбор — при этом каждая отобранная единица возвращается в совокупность и может снова попасть в выборку.

Бесповторный отбор — каждая отобранная единица не возвращается в совокупность.

На практике широко применяют моментные наблюдения, при которых обследованию подлежат все элементы совокупности (сплошное наблюдение), но на определенные моменты времени. Поэтому понятие генеральной и выборочной совокупности относятся к времени наблюдения, а не к совокупности, которое изучается. Моментные наблюдения широко применяются при изучении структуры затрат рабочего времени.

4. Ошибки выборки.

Сначала приведем основные условные обозначения.

Численность единиц генеральной совокупности обозначим через N, выборочной - n. Обобщающие характеристики генеральной совокупности — средняя, дисперсия, часть - называются генеральными и соответственно обозначаются , , р, где р - отношение числа М единиц, которые имеют данный признак, к общей численности генеральной совокупности (N), р= М/N.

Обобщающие характеристики выборочной совокупности имеют название выборочных и соответственно обозначаются .

Теория вычисления случайных ошибок базируется на работах выдающихся ученых Я. Бернулли, С. Пуассона, П.Л. Чебышева, А.А. Маркова, А.М. Ляпунова и др.

Закон больших чисел - общий принцип, согласно которому совокупное действие большого числа независимых факторов приводит к результату, которые почти не зависит от случая. В социально-экономической статистике это может быть сформулирован так: количественные закономерности, которые присущи массовым явлениям, выразительно проявляются лишь при достаточно большом числе наблюдений.

В каждой отдельной выборке из всех возможных случайная ошибка выборки  может принимать разные значения. При большом количестве наблюдений распределение случайных ошибок средней величины и части приближается к нормальному.

Следовательно, можно вести речь о средней ошибке выборки. Доказано, что при простом случайном отборе, проведенном по системе повторного отбора:

Если выборочное наблюдение применяется для определения части признака, то средняя ошибка части исчисляется по формуле

.

Используя функцию нормального распределения, можно вычислить вероятность предельной ошибки определенного размера. Так, вероятность того, что в отдельной выборке ошибка не превысит 2μ, составляет 0,954, а не превысит 3μ. — 0,997.

В приведенных формулах , p характеристики генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют выборочными характеристиками.

При бесповторном отборе средняя ошибка выборки равняется:

,

а ошибка доли:

Для решения практических задач вычисления средней ошибки выборки недостаточно, поэтому определяют предельный для определенной вероятности размер выборочной ошибки , где t - квантиль нормального распределения, которые называют коэффициентом доверия. Тогда предельные ошибки можно записать в виде таблицы 4.1.

Таблица 4.1

Предельные ошибки выборки при случайном (механическом) отборе

Схема отбора

Предельная ошибка выборки

для средней

для доли

Повторный

Бесповторный

Рассмотрим примеры определения предельной ошибки средней и доли.

Пример 4.1

Из отары овец общей численностью 1000 голов (М) выборочной контрольной стрижке было подвергнуто 100 голов (n), средний настриг шерсти при этом составлял 4,2 кг на одну овцу при среднем квадратичном отклонении 1,5 кг. Определить границы, в которых находится средний настриг шерсти для всех 1000 голов с вероятностью 0,954 (t = 2).

В данном разе имеем простой случайный отбор, вдобавок, разумеется, бесповторный. Подставим данные в соответствующие формулы:

Тогда одно из возможных значений, в границах которых может находиться средний настриг шерсти, рассчитывается по формуле

 В общем виде это записывается таким образом:

что равняется:

3,924,48.

Таким образом, на основании проведенной выборки гарантируем, что в 954 случаях из 1000 средний настриг шерсти будет находиться в границах: от 3,9 до 4,4 кг на одну овцу.

Пример 4.2

Для определения качества продукции отобрано 500 единиц из 10000. Среди них выявлено 50 изделий третьего сорта. Определить предельную ошибку доли с вероятностью 0,997.

Имеем, что часть изделий третьего сорта составляет

W= 50/500 = 0,1,

тогда часть первого и второго сортов составляет

р= 1 - W= 1-0,1 =0,9.

Подставим данные в формулу для простого случайного бесповторного отбора

Таким образом, на основании проведенной выборки установлено, что средний процент изделий третьего сорта составляет 10 % с возможным отклонением в ту или другую сторону на 3,9 %. С вероятностью 0,997 можно утверждать, что средний процент изделий третьего сорта во всей партии будет находиться в границах

р = 10% ± 3,9%, то есть 6,1%  13,9%.

Приведенные выше формулы средней и предельной ошибки выборки применяют при случайном и механическом отборах.

При типическом отборе предельная ошибка определяется по таким формулам (табл. 4.2).

Таблица 4.2

Предельные ошибки выборки при типическом отборе

Схема отбора

Предельная ошибка выборки

для средней

для доли

Повторный

Бесповторный

Если сравнить их с формулами для случайного отбора, то окажется, что вместо дисперсии и доли, которые определяются для выборочной совокупности в целом, при типичном отборе необходимо вычислить средние из групповых дисперсий и доли, полученные для каждой группы т.е:

. где ni – число элементов в i-ой группе, обладающих данным признаком, k – количество групп.

Пример 4.3

Проведена 10-процентная типическая выборка, пропорциональная численности отобранных групп рабочих (табл. 4.3).

Определить с вероятностью 0,954 границы, в которых находится средний процент выполнения норм рабочими в целом. Выборка бесповторная.

Таблица 4.3 Характеристика выборки рабочих

Группы рабочих по специальности

Количество, чел.

Среднее выполнение нормы, %

Средне квадратичное отклонение, %

Т

40

98

2

С

50

108

3

Ф

60

104

5

Вычислим общий средний процент выполнения нормы рабочими, которые попали в выборку:

Определим среднюю из групповых дисперсий:

Предельная ошибка выборочной средней для типического отбора:

где N = 1500, так как выборка 10-процентная.

Таким образом, с вероятностью 0,954 можно утверждать, что средний процент выполнения норм рабочими завода в целом находится в границах

= 103,7 ±0,581, отсюда 103,1 104,3.

При серийном отборе с равновеликими сериями предельная ошибка определяется по формулам приведенными в табл. 4.3, где S — общее число серий в совокупности. В данном случае каждая серия является единицей совокупности, и мерой колебания будет межсерийная выборочная дисперсия:

где , — средняя для каждой серии; общая выборочная средняя, s — число отобранных серий.

Таблица 4.4

Предельные ошибки выборки при серийном отборе

Схема отбора

Предельная ошибка выборки

для средней

для доли

Повторный

Бесповторный

Если сравнить их с формулами для случайного отбора, то окажется, что вместо дисперсии и доли, которые определяются для выборочной совокупности в целом, при серийном отборе необходимо вычислить межгрупповую дисперсию средней и доли.

Пример 4.4

Для определения средней урожайности сахарной свеклы в области проведена 20-процентная серийная выборка, в которую вошло 5 районов из 25. Средняя урожайность для каждого района составляла: 250, 260, 275, 280, 300 ц/га на площади 800, 1000, 1200, 1200 и 2800 га соответственно. Определить с вероятностью 0,954 границы, в которых будет находиться средняя урожайность сахарной свеклы по области.

Сначала найдем общую среднюю:

Определим межсерийную дисперсию:

Рассчитаем предельную ошибку серийного бесповторного выбора:

Итак, с вероятностью 0,954 можно утверждать, что средняя урожайность сахарной свеклы по области будет находиться в границах от 272,66 ц/га до 287,34 ц/га. Таким образом рассчитываются средняя и предельная ошибки для доли.

5. Определение необходимой численности выборки.

Прежде чем приступить к проведению выборочного наблюдения, надо определить необходимую численность выборки, то есть такой объем выборочной совокупности, который обеспечил бы необходимую точность результатов.

Необходимая численность п определяется на основе формул предельной ошибки. Формулы для случайного и механического отборов приведены в табл. 4.5.

Таблица 4.5

Определение объема выборочной совокупности

Схема отбора

Объем выборки

для средней

для доли

Повторный

Бесповторный

Пример 4.5

В районе есть 2500 коров. Требуется определить необходимый объем случайной выборки для повторной и бесповторной схемы при условии, что предельная ошибка вычисления среднего годового надоя не будет превышать 20 кг при вероятности 0,954 и = 300.

Для повторного отбора

= 900 голов.

Для бесповторного отбора

= 662 головы.

Пример 4.6

Определим объем выборки при вычислении доли. Установлено, что ошибка доли с вероятностью 0,954 не должна превышать 3% при удельном весе в 80%.

Для повторного отбора

коровы.

Для бесповторного отбора

коровы.

При определении необходимого объема выборки  генеральной и выборочной совокупности неизвестны. Поэтому эти значения устанавливают приблизительно на основании аналогичных или пробных исследований. Если признак альтернативен, то считают, что W= 0.5, W(1-W) = 0,25.

6. Особенности малой выборки.

Малой выборкой принято считать выборку, объем которой варьируется в границах от 5 до 30 единиц. Малая выборка является единственным исследовательским приемом в тех случаях, когда организация сплошного или большого выборочного наблюдений невозможная. Преимущественно этим выборочным методом пользуются в случае исследования качества промышленной продукции, при установлении норм выработки. Однако, следует отметить, что необходимо быть осторожной при использовании малой выборки.

Как известно из теории выборочного наблюдения, репрезентативность выборки в значительной мере зависит от ее объема. Случайные ошибки выборки при достаточно большом объеме распределяются нормально. При этом допускается условие равенства генеральной и выборочной дисперсии.

При условии малой выборки этим предположением пользоваться нельзя. Ее особенность как раз и состоит в том, что случайные ошибки малой выборки не подчиняются закону нормального распределения. Поэтому для оценки результатов малой выборки и возможных границ ее случайной ошибки пользуются отношением Стьюдента:

где  - стандартная ошибка малой выборки, которая исчисляется по формуле

Как видим из этой формулы, в знаменателе берется не п, как в обычной выборке, а п — 1, что является принципиально важным в случае для расчета ошибки малой выборки. Предельная же ошибка малой выборки исчисляется стандартным способом по формуле

где t -  это отношение Стьюдента.

Величина t подчиняется закону распределения Стьюдента (t верно только для выборок, которые взятые из генеральной совокупности с нормальным распределением признаков). Для определения вероятности интенсивности Р(t) пользуются специальными таблицами, в которых рассчитаны Р(t) для данных значений t и k = n-1 (k- число степеней свободы). Некоторые значения Р(t) приведены в таблице 4.6

Таблица 4.6

Вероятность P(t) распределения t (Pk(t)*1000)

t

k

4

5

6

7

8

9

10

15

2.0

884

898

908

914

919

923

927

936

954

2.5

933

946

953

959

963

966

969

976

988

3.0

960

970

976

980

983

985

987

991

997

C помощью этой таблицы определяется двусторонний критерий, то есть вероятность того, что фактическое значение t из-за случайных причин не будет больше табличного по абсолютной величине.

Пример 4.7.

На электроламповом заводе с целью проверки качества ламп была организована малая выборка (табл. 4.7). В случайном бесповторном отборе было отобрано 10 ламп.

Необходимо определить предельную ошибку выборки и построить доверительный интервал для средней.

Таблица 4.7

Расчет предельной ошибки выборки

Продолжительность горения, ч. (xi)

Число ламп, шт. (fi)

xi* fi

fi

1480

2

2960

26

676

1352

1500

4

6000

6

36

144

1520

3

4560

14

196

588

1540

1

1540

34

1156

1156

Итого

10

15060

X

X

3240

Выборочная средняя равна

 ч.,

выборочная дисперсия:

стандартная ошибка:

=6 ч.

В условиях малой выборки при k=n-1=9 и t=2,5 с вероятностью Рk(t), которая равна 0,966, предельная ошибка по абсолютной величине не превысит

Δm =2,5*6=15 ч.

Вероятность того, что это утверждение неверно и ошибка может выйти за установленные пределы 15 ч., равняется: 1-0,966 = 0,034.

На основе рассчитанных характеристик строим доверительный интервал для генеральной средней:

1491  1521.

Вопросы для самоконтроля.

1. Какие виды статистического наблюдения выделяют в зависимости от охвата единиц совокупности?

2. Какие вы знаете организационные формы проведения наблюдения?

3. Назовите принципы формирования выборочной совокупности.

4. От чего зависит объем выборочной совокупности?

5. Для чего при проведении выборочного наблюдения определяется необходимый объем выборки?

6. Чем определяется предельная ошибка выборки?

7. Что представляет собой механический способ отбора? Приведите пример.

8. Какие существуют схемы отбора, условия их применения?

9. В чем состоят особенности типического отбора? Приведите пример.

10. Как проверить репрезентативность выборочной совокупности?

11. Как изменится величина случайной ошибки, если объем выборки увеличить на 21%?

12. Изменится ли средняя ошибка выборки, если вместо повторного отбора провести бесповторный отбор?

13. По выборочным данным удельный вес бракованной продукции на первом предприятии составляет 3%, на втором — 5%. Для которого из них ошибка выборки будет большая и на сколько, если объем выборки был одинаковый?

14. Средняя ошибка выборки для части бракованой продукция составляет 2%, удельный вес брака в выборке — 3%. С какой вероятностью можно утверждать, что доля брака в генеральной совокупности не будет превышать 7%?

15. На участке леса площадью 1000 га необходимо определить общий запас древесины (в куб. м). Испытанная площадь составляет 0,1 га. В результате обследования выявлено, что выход древесины с 0,1 га составляет 10 м3. Каким должен быть объем выборки, чтобы ошибка не превышала 4 м3 (р = 0,954)?

16. В почтовом отделении города планируется проведение выборочного случайного наблюдения для определения части писем, адресованных за границы Украины. Результаты необходимо оценить с точностью 1%(p= 0,954). Сколько писем надо отобрать?

17. На предприятии насчитывается 100 бригад одинаковой численности. Бесповторно отобрано 36 бригад. По результатам выборки средний стаж рабочего составляет 7 лет. Межсерийная дисперсия равняется 9 лет. Определить предельную ошибку выборки - 0,954).

18. В чем состоит особенность применения малой выборки?

19. Каким правилом пользуются при определении предельной ошибки малой выборки?


 

А также другие работы, которые могут Вас заинтересовать

72681. Проектирование технологического процесса изготовления детали “Крышка подшипника” 243.38 KB
  Выбор метода получения и проектирования заготовки Выбор метода обработки поверхностей детали. Выбор методов и средств контроля точности изготовления детали. Вывод по работе Список используемой литературы Приложение Анализ чертежа детали и её служебного назначения.
72682. Павильонная фотосъёмка 2.01 MB
  Количество и мощность применяемых при этом источников света должны соответствовать величине освещенности необходимой для получения высококачественного снимка. В соответствии с ними регулируется сила света осветительных приборов их расстановка что позволяет решать композиционные задачи...
72683. Вручение орденов и медалей Временного правительства и Белого движение в ходе Гражданской войны в России (1917-1922) 49.68 KB
  На разных фронтах Гражданской войны этот вопрос решался по-разному: в некоторых белогвардейских армиях старались обходиться запасами царских орденов и медалей – в армии А.В. Колчака вручались даже ордена Святого Георгия, чего не наблюдалось на других участках Гражданской войны.
72684. Вскрытие и промышленная разработка Тишинского месторождения 688.54 KB
  При выборе методики разведки Тишинского месторождения особенно на первых этапах изучения – до 1964 года наряду с геологическими особенностями решающее влияние имел фактор времени необходимость быстрейшего ввода его в эксплуатацию и геоморфологические условия.
72686. Структурный синтез логического преобразователя УА 275.05 KB
  Потребность в вычислениях возникла у людей на самых ранних стадиях развития человеческого общества. Причем с самого начала для облегчения счета люди использовали различные приспособления ( счеты, арифмометры). Многие из них были весьма интересными и остроумными по принципу действия...
72688. РАЗРАБОТКА ЭКСПЕРТНОЙ СИСТЕМЫ С ПРИМЕНЕНИЕМ РЕЛЯЦИОННОГО ПОДХОДА СУБД ACCESS И С ИСПОЛЬЗОВАНИЕМ СРЕДСТВ VISUAL PROLOG 2.09 MB
  Систему, которую намерены построить мы, относится к классу идентификационных (или диагностических) систем. Системы этого класса решают задачу определения, т.е. идентификации, объекта по его признакам.