Главная Каталог статей Полезные ссылки Поиск по сайту Гостевая книга Добавить статью

Главная arrow Каталог статей arrow Научная библиотека arrow Методы социологических исследований 

РАБОЧАЯ КНИГА СОЦИОЛОГА II-VI глава
Рейтинг: / 1
ХудшаяЛучшая 
12.12.2006 г.
Оглавление
РАБОЧАЯ КНИГА СОЦИОЛОГА II-VI глава
Страница 2
Страница 3
Страница 4
Страница 5
Страница 6

.

Глава шестая

Выборочный метод в социологическом исследовании

 

В марксистской социологии имеются давние традиции по приме­нению методов статистического наблюдения. В настоящее время без них практически немыслимо проведение эмпирических социоло­гических исследований.

В целом эти методы могут быть разделены на сплошные и не сплошные. Сплошное статистическое наблюдение требует полного охвата объекта исследования, всех его элементов без исключения.

Сплошное исследование некоторых социальных объектов по мно­гим причинам может оказаться или очень трудоемким, или требую­щим больших денежных затрат, или просто невозможным. В этих случаях используются методы не сплошного наблюдения, которые очень хорошо себя зарекомендовали в различных областях науки и техники.

Строгому научно обоснованному выбору части социальных объ­ектов как методу исследования всей совокупности большое значе­ние придавал В. И. Ленин. Он предлагал провести выборку «для изучения небольшого числа типичных предприятий (фабрик, совхо­зов) и учреждений (a) наилучших, образцовых; (b) средних и (g) наихудших»1.

Наиболее часто в социологии используются три метода несплошного наблюдения: 1. Монографический, 2. Метод основного массива, 3. Выборочный.

Монографический метод, строго говоря, выходит за рамки чисто статистического наблюдения, ибо наряду с фиксацией статистических данных предполагает детальное качественное описание массо­вых явлений. Выбираемая для монографического исследования часть объекта очень часто является типичной, в определенном смысле, для всего объекта или для важнейших его элементов.

 

Именно эта особенность, дающая возможность глубокого проник­новения в сущность изучаемых массовых явлений, представляет важнейшее достоинство монографического метода, который, как правило, применяется в социологии в комбинации со сплошным или раз­личными видами не сплошпого исследования.

Известно, например, какую роль В. И. Ленин отводил монографи­ческому методу наблюдения за состоянием сельского хозяйства в нашей стране в целях его скорейшего подъема. В. И. Ленин выде­лял три группы крестьянских хозяйств по уровню их развития: «...поставленные заведомо хорошо, сносно и неудовлетворительно. Одно типичное хозяйство каждой из этих последних трех групп долж­но быть не менее двух раз в год описываемо подробно с точным указанием всех данных об описываемом хозяйстве...»2.

Значение монографического метода не ограничивается примене­нием лишь к типичным объектам социологического исследования. Он оказывается весьма полезным при изучении объектов в социаль­ном эксперименте, когда зарождается передовой опыт, намечаются ростки прогрессивных явлений.

Методом основного массива, как правило, изучается большая часть объекта социологического исследования или его важнейшие элементы. Этот метод находит применение, например, в некоторых социологических исследованиях, проводимых с помощью контент-анализа.

Разновидностью метода основного массива являются экспертные опросы, так как при организации таких опросов стараются привлечь большую часть наиболее компетентных экспертов.

Наиболее широкое распространение в социологических исследо­ваниях получил  выборочный метод. В этой главе подробно рас­сматривается суть этого метода и основные процедуры его примене­ния в социологии.

 

1.               Основные понятия выборочного метода

 

Генеральная и выборочная совокупности.

Множество социальных объектов, которые являются предметом изучения в пределах, очерченных программой социологического исследования и территориаль­но-временными границами, образует генеральную совокупность.

Любую генеральную совокупность характеризует некоторый явно задаваемый признак (или набор признаков), по значению которого всегда можно однозначно определить, относится данный объект к генеральной совокупности или нет. Так, в качестве генеральной со­вокупности мы можем рассматривать жителей данного города, промышленно-производственный персонал предприятия, студентов всей страны и т. п. Часть объектов генеральной совокупности, выступаю­щих в качестве объектов наблюдения, называется выборочной сово­купностью. Иными словами, если генеральная совокупность включает все без исключения единицы, составляющие объект исследования, то выборочная совокупность представляет собой специальным образом отобранную часть генеральной совокупности. При этом ста­тистическое наблюдение осуществляется именно за элементами вы­борочной совокупности.

Внимательный читатель может заметить, что метод основного массива и метод монографического исследования также предполага­ют статистическое наблюдение некоторой части исследуемой сово­купности. В чем же характерный признак выборки? Выборочная со­вокупность обычно конструируется таким образом, чтобы при мини­муме исследуемых объектов удавалось с необходимой степенью га­рантии представить всю генеральную совокупность.

Единица отбора и единица наблюдения.

Единицей отбора называют элементы генеральной совокупности, которые выступают еди­ницами, счета в различных процедурах отбора, формирующих вы­борку.

Единицами наблюдения называют элементы сформированной вы­борочной совокупности, которые непосредственно подвергаются ста­тистическому наблюдению. Единица отбора и единица наблюдения представляют собой социальные объекты, обладающие характери­стиками, существенными для предмета конкретного социологического исследования. Они могут совпадать (в простых схемах отбора) и различаться (при сложных комбинированных схемах отбора).

Систематические и случайные ошибки статистического наблюде­ния. При получении социальной информации выборочным методом могут возникать ошибки различного рода. Причинами могут быть неточность данных, сообщенных социологу респондентом, непра­вильная фиксация получаемых сведений или неправильное измере­ние переменных, характеризующих единицы наблюдения, и т. д. Эти ошибки, называемые иногда ошибками регистрации, могут быть разделены на два типа: случайные и систематические.

Систематической ошибкой регистрации называется ошибка, выра­жающая некоторые существенные связи, возникающие в процессе регистрации между объектом, субъектом  и условиями проведения наблюдения. Систематическая ошибка может быть значительной по - своей величине из-за одностороннего искажения (в сторону увели­чения или уменьшения)  исследуемой характеристики. Происходя­щее вследствие этого накопление ошибки по исследуемой совокуп­ности в целом может зачеркнуть результаты всего исследования.

Систематическая ошибка регистрации может возникнуть при любом типе статистического наблюдения, в той числе и при проведении выборочного или сплошного обследования.

Характерным примером систематической ошибки являются дан­ные о женатых мужчинах и замужних женщинах во Всесоюзной переписи 1970 г. По результатам переписи в целом по Союзу ока­залось 53,0 млн. женатых мужчин и 54,2 млн. замужних женщин. Систематическая ошибка, зафиксированная в этой переписи, обра­зовалась из-за погрешностей в ответах, возникающих от различной оценки своего семейного положения мужчинами и женщинами.

Случайные ошибки регистрации отражают менее существенные связи между объектом, субъектом и условиями регистрации и скла­дываются из различных статистических погрешностей в процессе наблюдения. Погрешности, имея различную направленность в от­дельных единицах наблюдения, проявляют тенденцию к взаимно­му погашению при обобщении результатов регистрации по всей ис­следуемой совокупности.

Таким образом, в отличие от систематической случайная ошибка вызывается при наблюдении причинами, носящими вероятностный характер.

Типичные ошибки выборочного социологического исследования. Ошибки регистрации встречаются при любом типе статистического наблюдения и, следовательно, свойственны и выборочному методу исследования.

Кроме того, в выборочном исследовании могут появиться ошиб­ки, возникающие при различных отклонениях от планируемой вы­борки. Можно выделить два наиболее типичных вида отклонения от  плана выборки.

1. Замена намеченных при планировании выборки единиц на­блюдения другими, более доступными, которые, однако, оказывают­ся неполноценными с точки зрения выработанного плана выборки.

Такого рода ошибки могут возникать при использовании недо­статочно квалифицированных интервьюеров. Например, опрос пла­нируется провести в каждой десятой квартире жилого массива. Ни­кого не застав в выбранных квартирах, интервьюер иногда обраща­ется в соседние квартиры и берет интервью. В итоге в выборке, ока­зывается значительная доля пенсионеров, больших по размеру семей и слабо представлены одинокие лица и малочисленные семьи. Оши­бок этого типа (ошибок подстановки) можно избежать, контролируя деятельность анкетеров и интервьюеров и Качество собранной ими информации. В противном случае они могут привести к серьезным Систематическим ошибкам. .

2. Неполный охват выборочной совокупности, т. е. неполучение информации от части единиц наблюдения, включенных в выборку (например, недополучение почтовых анкет, не полностью заполнен­ные анкеты).

Эти ошибки устанавливаются путем сравнения реально сформи­рованной выборки с ее планом. Ошибки подобного рода «снимают­ся» так называемой процедурой «корректировки» выборки, т. е. пу­тем специального пересчета значений изучаемого признака с уче­том того, какая именно часть выборочной совокупности выпала из обследования.

Распространенными ошибками в выборочном социологическом исследовании являются ошибки, возникающие при неправильной разработке плана выборки. Только правильно намеченный и, конеч­но, реализованный план формирования выборочной совокупности может дать определенные гарантии для распространения выво­дов, полученных по выборке, на всю генеральную совокупность.

Во многих книгах в качестве примера смещения, возникающего из-за неправильного планирования выборки, приводится известный опрос, проведенный «Литэрари Дайджест» («Литературное обозре­ние») относительно исхода президентских выборов 1936 г. в США.

Кандидатами на этих выборах были Ф. Д. Рузвельт и А. М. Лан-дон. Редакция журнала организовала план выборки следующим об­разом. В выборку попали более двух миллионов американцев, выб­ранных при помощи случайного отбора из списков, имеющихся в телефонных книгах. По всей стране попавшим в выборку лицам были разосланы открытки с просьбой назвать фамилию будущего президента. Затратив огромную сумму на рассылку, сбор и обра­ботку полученных открыток, журнал информировал общественность, что на предстоящих выборах президентом США с большим перевесом будет избран А. М. Ландон. Результаты выборов опровергли этот прогноз.

В то же время социологи Д. Гэллап и Э. Роупер правильно пред­сказали победу Ф. Д. Рузвельта, основываясь только на четырех тысячах анкет.

Ошибочный прогноз относительно возможного президента объ­ясняется неправильным планом выборки, который не обеспечил пол­ного отражения в ней всей генеральной совокупности: в телефонных книгах, которые использовались для организации выборки, были представлены лишь наиболее обеспеченные слои американского на­селения, в частности домовладельцы. Поскольку обеспеченные слои американцев составляют меньшую часть генеральной совокупности, то распространение мнения этой части населения на всю страну в целом оказалось ошибочным.

Ошибки часто возникают и в тех случаях, когда в выборочную совокупность преимущественно попадают представители одинако­вых социальных групп. Так, почтовые анкеты чаще заполняют ли­ца с более высоким уровнем образования, причем мужчины чаще, чем женщины, пенсионеры чаще, чем работающие и т. д.

Социолог самое пристальное внимание должен уделять анализу возможностей возникновения ошибок смещения в выборочных со­циологических исследованиях.

Репрезентативность выборки. Выборка в определенном смысле должна быть моделью генеральной совокупности, что и позволяет на ее основе оценивать характеристики этой совокупности. Однако нет необходимости моделировать в выборке все аспекты генераль­ной совокупности, достаточно лишь значимых с точки зрения задач исследования. Свойство выборки отражать, моделировать эти харак­теристики будем называть репрезентативностью.

Основной принцип построения выборки (точнее, вероятностного отбора) состоит в том, чтобы обеспечить всем элементам генераль­ной совокупности равные шансы попасть в выборку. Однако даже самое аккуратное соблюдение этого принципа не гарантирует выбор­ку от искажений. Эти искажения — случайные ошибки — внутренне присущи выборочному методу. Они появляются в результате того, что обследуются не все единицы совокупности, а только выборка, и, следовательно, результат будет неточен, так как единицы совокупности не тождественны между собой. Значение случайной ошибки можно сравнительно легко вычислить, используя аппарат, разрабо­танный в статистической теории выборочного метода. Таким обра­зом, репрезентативность выборки будет определяться двумя компо­нентами: ошибками регистрации и случайными ошибками.

В  идеальной  ситуации   в  сплошном   исследовании   отсутствуют

ошибки репрезентативности, благодаря чему при правильной орга­низации наблюдения ошибка выборочного исследования больше ошибки наблюдения при сплошном обследовании. Однако в социо­логии применение сплошного обследования требует значительного числа анкетеров и интервьюеров, а это ведет к тому, что иногда при­влекаются недостаточно квалифицированные кадры, участие кото­рых в исследовании увеличивает ошибку регистрации. И наоборот, применение выборочного исследования при решении тех же вопро­сов позволяет использовать более подготовленные кадры специали­стов, обеспечить лучший их инструктаж, контроль за его выполне­нием. Это ведет к уменьшению ошибки регистрации. И если слу­чайная ошибка не велика, то ошибка выборочного наблюдения в целом может оказаться меньше ошибки сплошного исследования. Таким образом, при определенных условиях выборочный метод ока­зывается более точным, чем сплошной, что еще раз подчеркивает его преимущество при организации и проведении эмпирических со­циологических исследований.

 

2.     Простой случайный отбор

 

Основа выборки. Для организации простых схем отбора (простой случайной, систематической или серийной выборок) необходима ин­формация обо всех элементах генеральной совокупности или хотя бы их перечень.

Основой выборки называют перечень элементов генеральной со­вокупности, если он удовлетворяет требованиям полноты, точности, адекватности, удобства работы с ним, отсутствия дублирования единиц наблюдения. Основой могут служить алфавитные списки сотруд­ников учреждения, номера пропусков, по которым можно иденти­фицировать определенные единицы, и т. п.

Полнота. Под полнотой подразумевается представленность всех единиц данной генеральной совокупности в основе выборки. Если некоторые единицы, которые по предположению должны быть в списке, не зарегистрированы в нем, то список является неполным.

Неполнота основы выборки приводит к серьезным ошибкам в том случае если не включенные в выборочную совокупность единицы на­блюдения имеют существенные особенности и их достаточно много.

Отсутствие дублирования. Если некоторые единицы наблюдения генеральной совокупности будут включены в основу выборки более чем один раз, то они могут повторяться и в выборке (например, в том случае, когда человек переезжает из одного района в другой и включается в новый список раньше, чем исключается из старого).

Точность. Информация о каждой единице отбора должна быть  точной. Основа выборки не должна содержать несуществующих еди­ниц. Подобные неточности встречаются в избирательных списках, когда отсутствуют вновь прибывшие в данный населенный пункт,  или остаются лица, изменившие свое местожительство, умершие, жильцы снесенных домов и т. п.

Адекватность. Основа выборки, адекватная для решения одних задач, может быть неадекватной для других. Например, полный спи­сок работников промышленного предприятия может быть хорошей основой для формирования выборочной совокупности при исследо­вании проблем удовлетворенности трудом работников данного предприятия, уровня их социальной активности и т. д. Но если изуча­ется удовлетворенность трудом или социальная активность и т. д. не всех работников предприятия, а только молодёжи; то этот полный, список может послужить лишь для формирования новой основы вы­борки — списка молодежи.

Если основа охватывает не все социальные объекты генеральной совокупности, то она может использоваться как основа выборки для той части генеральной совокупности, которая представлена полно­стью, а выбор единиц наблюдения из остальной части следует организовать по другим источникам.

Удобство. Удобство  работы с основой выборки — существенное условие повышения качества результатов. Удобно, когда единицы составляющие  основу выборки,  пронумерованы,  когда  имеющиеся сведения о них дают возможность с полной определенностью опоз­навать эти единицы. Если основа выборки находится в одном цент­рализованном месте и ее структура соответствует реальной структуре изучаемых социальных объектов, это не только облегчает рабо­ту социолога, но и является необходимым требованием к исследова­нию, значительно повышающим его качество.

Одной из причин возникновения сложных схем выборки (многоступенчатых,  комбинированных  и  т.  п.)   является  невозможность обеспечить основу выборки для очень больших, генеральных сово­купностей, обладающих сложной структурой.

К настоящему времени сложились представления об основе, ко­торая могла бы удовлетворить требованиям организаций современ­ных социологических исследований, быть действенной для различ­ного типа исследований. Такой основой является социальная карта.

Социальная карта. Подобно тому, как географическая карта явля­ется ориентиром в пространственном движении, социальная карта должна стать ориентиром в исследовании социальных объектов. Со­циальная карта представляет собой пространственное распределе­ние всевозможных социальных показателей для определенных эко­номико-географических регионов. Такая карта может служить осно­вой всех выборочных исследований в каждом регионе, области,, районе, городе и т. п.

Процесс составления социальной карты складывается из следую­щих этапов.

1. Сбор информации о размещении и движении населения, об основных постоянных и сезонных потоках населения, которые выражаются в демографических показателях.

2. Сбор социально-экономической информации относительно профессионального состава населения: данные о квалификации, зара­ботной плате, соотношения между работающими и неработающими, распределение уровня семейных доходов и т. д.

3. Сбор социологической информации: условия труда и быта; данные о проведении досуга, о его структуре по различным социальным группам; данные о различных формах социальной активности, обра­зовательном уровне, средствах массовой коммуникации, об активно­сти партийных и общественных организаций и т. д.

Возрастающий  интерес  социологов   к  построению   социальных карт связан в значительной степени с прикладными задачами выбо­рочного обследования. Для более углубленной разработки социальных проблем необходима и более основательная исходная социальная информация: карта размещения социальных групп, распространенности средств массовых коммуникаций и т. д., т. е. социальная   карта.  

Процедура простого случайного отбора.

По сформированной основе выборки легко реализовать процедуру простого случайного отбора. Для этого требуется соблюдение равенства шансов попадания единиц отбора в   выборочную совокупность. Выделяют: а) простой случайный бесповторный отбор и б) простой случайный повторный отбор.

Осуществляться каждая   из разновидностей   процедуры   может различными способами. Опишем один из них. Пусть основа выборки содержит N единиц. Тогда, чтобы выбрать п единиц наблюдения в выборочную совокупность, напишем все номера от 1 до N на отдельныe карточки, тщательно их перемешаем и наугад вынем одну из них. Номер вытащенной карточки задает соответствующую единицу  наблюдения,   попавшую  в  выборочную  совокупность.   Затем карточка возвращается на место, они снова перемешиваются, наугад, вынимается новая карточка, и так далее продолжается п раз. Так реализуется процедура простого случайного повторного отбора. Если извлеченную карточку не возвращать назад, а откладывать в сторону, то тот же процесс приведет нас к простой случайно бесповторной выборке размером в п единиц наблюдения или, как еще  говорят, объемом в n единиц.

Описанная процедура простого, случайного отбора становится чрезвычайно трудоемкой, если число N, задающее объем основы вы­борки, велико. Главная трудность состоит в том, что обеспечение равной вероятности попадания единицы наблюдения в выборочную совокупность требует очень тщательного перемешивания.

Чтобы устранить трудности, возникающие при исследовании больших генеральных совокупностей (а именно таких большинство в социологии), для реализацию простого случайного отбора пользуются так называемыми таблицами случайных чисел. Они содержат те или иные случайные цифры, полученные путем реализации некоторого физического случайного процесса, В литературе приводятся различные  последовательности случайных -чисел  объемом  от  нескольких десятков до миллиона цифр (табл. 14).

Продемонстрируем, как работать с таблицей случайных чисел, на гипотетическом примере, когда из совокупности заранее прону­мерованных 300 единиц необходимо выбрать 7 единиц наблюдения. Поскольку N= 300 — трехзначное число, а в табл. 14 даны пяти­значные числа, будем использовать только три последних цифры каждого числа.

Начиная с первого числа, двигаясь по строке, получим первый номер 97. Числа более 300 пропускаем и, продолжая этот процесс далее, получим ряд чисел: 296, 209, 13, 157, 147, 32.

Это и есть номера единиц наблюдения, попавших в формируемую выборку.

При организации бесповторного отбора приходится пропускать и числа (если они попадаются), которые встречаются второй раз в этом ряду.

Начинать процесс выбора случайных чисел можно с любого места таблицы и вести его в любом направлении (по строкам, столбцам и т. п.) или выбирая только определенные столбцы. Если име­ющиеся под рукой таблицы достаточно длинны, то при решении очередной задачи выбора рекомендуется начинать с нового места таблицы.

Расчет характеристик простой случайной выборки.

Цель любого выборочного исследования состоит в том, чтобы, сформировав вы­борку, собрать по ней информацию и на основе этой информации оценить искомые характеристики генеральной совокупности.

Наиболее распространенной в социологических исследованиях задачей является оценка среднего значения признака (или доли в случае качественного признака) в генеральной совокупности.

Проиллюстрируем на примере нахождение выборочной оценки среднего генеральной совокупности. Предположим, что оценивается среднее число  газет и общественно-политических журналов, выпи­сываемых сотрудниками некоторого производственного коллектива. Рассмотрим по порядку все необходимые операции и их результаты.

 Составляется основа выборки, т. е. список всех единиц отбора. В качестве такой основы может быть взят алфавитный список всех сотрудников, пронумерованных последовательно (табл. 15). В целях  наглядности вместе с основой выборки приводятся и все истинные значения единиц отбора, еще неизвестные исследователю. В дальнейшем сопоставим истинное значение искомого параметра и выборочную оценку.

Общая сумма выписываемых газет и журналов равна 150. Среднее число выписываемых газет и журналов на каждого сотрудника равно = 150/50 = 3.

Среднее квадратическое отклонение для генеральной совокупности равно

Сумма квадратов отклонений равна 146 при условии, что одно значение квадрата отклонения, а именно от единицы отбора 28, было исключено из суммы. Это значение, равное 49, резко увели­чивает сумму, будучи нетипичным для генеральной совокупности.

Такое «исключение» экстремального отклонения нередко применя­ется при обработке первичной социальной информации в том случае, когда предусмотрено возведение в квадрат, а само отклонение в 2—3 раза превышает среднее значение параметра.

Однако ни среднее значение параметра, ни среднее квадратическое отклонение перед началом исследования не известны. В про­тивном случае само исследование было бы излишним.

Естественно предположить при анализе вышеприведенного примера, что каждый респондент (единица отбора и единица наблюде­ния) выписывает несколько газет и журналов и что количество выписываемых газет и журналов не слишком сильно варьирует (если бы путем выборочного исследования потребовалось определить, скажем, объем личных библиотек, положение исследователя ослож­нилось бы). Исходя из этих соображений, полагаем достаточной вы­борку, состоящую из пяти респондентов. Проверить правильность определения объема выборки можно только после обработки резуль­татов пилотажного исследования.

Предположим, что случайный выбор из табл., 15 дал следующие результаты: выбраны номера 18, 4, 28, 39, 22; они соответствуют  Значениям признаков 4, 0, 10, 4, 4.

Среднее арифметическое  но выборке х = 22/5 = 4,4, дисперсия

Такое значительное отклонение от истинного значения средней объясняется тем, что в выборку попал респондент № 28, исключен­ный при подсчете дисперсии для генеральной совокупности как нетипичный. Однако при формировании выборки еще неизвестно, что данный респондент нетипичен. Но сам факт, что среднее квадратическое отклонение приближается по величине к средней, дол­жен насторожить исследователей.

Для большей наглядности выразим s в процентах от величины  средней: (3,5:4,4) • 100%= 79%, т. е. среднее отклонение значений признака от выборочной средней арифметической величины «оставляет 79%. В таких случаях целесообразно увеличить объем выборки, например, в 2 раза. В результате были отобраны номера: 44, 2, 12, 26, 14, 27, 35, 9, 8, 49; значения признака 5, 2, 4, б, 1, -3,2,5,3, 4.

Среднее арифметическое — 3,6, дисперсия s2 = 2,26, среднее квадратическое отклонение s = 1,5. Теперь оно составляет прибли­зительно 40% от величины средней. При больших дисперсиях объем выборки увеличивают с учетом практических возможностей до тех пор, пока дисперсия не перестает уменьшаться. Дальнейшее увеличение объема выборки является нецелесообразным. Обычно исследователь приходит к некоторому компромиссному решению от­носительно объема выборки в зависимости от требуемой точности, а также средств и времени, которыми он располагает.

Сводка необходимых формул для простой случайной  выборки. В рассмотренном гипотетическом примере легко было оценить ка­чество выборочной оценки среднего (перед глазами была информация    дня обо всей генеральной совокупности). Но как провести его оценку в  реальном исследовании, когда имеется  только информация, полученная из выборки?

На помощь приходит статистическая теория выборочного метода. Она позволяет при условии реализации случайного отбора достичь, по крайней мере, следующих двух целей:

1. По заданной априори необходимой степени точности выводов (формализуемой с помощью понятия доверительной вероятности) найти возможные интервалы, изменения характеристик генеральной; совокупности (доверительные интервалы). И наоборот, рассчитать доверительную вероятность отклонения характеристики генеральной совокупности от выборочной по заданной величине доверительного интервала.

2. Найти объем планируемой выборки, позволяющей достигнуть в пределах требуемой точности расчета выборочных характеристик необходимую доверительную вероятность.

Дадим сводку необходимых для достижения этих целей формул3.  Чтобы уметь применять приведенные формулы при планирова­нии выборки в эмпирическом социологическом исследовании, позна­комимся несколько подробнее с основными понятиями выборочного метода— «доверительная вероятность» и «доверительный интервал».

Теоретико-вероятностные теоремы, восходящие к закону больших чисел, позволяют с определенной вероятностью, обозначаемой (1 —а), утверждать, что для изучаемого признака отклонения вы­борочной средней от генеральной не превысят некоторой величины D, называемой предельной ошибкой выборки.

В одной из формулировок это утверждение записывается сле­дующим образом:

Смысл приведенного соотношения следующий: с доверительной вероятностью  (1-a)  можно утверждать, что генеральное среднее лежит в интервале

 

который и называется доверительным интервалом, а определяет как бы степень доверия к данным, получаемым по рассчитанным с его помощью выборочным характеристикам. Отсюда и название а — уровень значимости.

Принятие того или иного уровня значимости, например 5%-ного (a = 0,05), зависит от целей данного социологического исследования, требований к степени гарантии его результатов. Социолог должен четко понимать, что, выбрав, скажем, уровень значимости, равный 5 %, и, рассчитав на основе его выборочные характеристики, мы  будем утверждать наличие некоторого эффекта, который на самом деле может оказаться несправедливым приблизительно в пяти про­центах случаев.

Пример. При обследовании 900 человек — лиц трудоспособного возраста — определен их средний возраст. Для вероятности (1 — a) =0,90 необходимо найти доверительный интервал, в котором содер­жится генеральное среднее. Поскольку дисперсия признака неиз­вестна, оценим ее приблизительно по значению размаха для гене­ральной совокупности.

С этой целью воспользуемся соотношением связи среднего квад­ратичного отклонения с размахом

справедливым в предположении нормального характера распреде­ления. Здесь Хmax — Хmin — вариационный размах генеральной сово­купности, а V— величина, зависящая от объема выборки, значения которой можно найти в табл. 17.

Так как по всей генеральной совокупности верхняя граница трудоспособности в СССР — 60 лет, а нижняя — 16, то хmax — хmin =60—16 = 44, следовательно (для п> 100 — последний столбец

табл.   17),   получим   приближенное   значение   среднеквадратичного отклонения  s=44:5= 8,8.

Величина Z находится по табл. А приложения при a/2. Таким образом, если 1 — a= 0,9, то Z = 1,64,

Подставляя найденные значения М и Z в формулу предельной ошибки, получаем D = ZM = 1,64 • 0,29 = 0,48.

Таким образом, округляя значение ошибки до половины года (0,5), можно утверждать, что с вероятностью 0,9 генеральное сред­нее не выйдет за пределы интервала х — 0,5 < М < х + 0,5, т. е. точность выборочной оценки среднего, рассчитанной по нашей вы­борке (если она организована методом простого случайного повтор­ного отбора), оказывается равной половине года. Утверждать это мы можем с вероятностью 0,9. Интервал (х — 0,5, х + 0,5) и задает доверительный, интервагй, рассчитанный по доверительной вероятности, равной 0,9.

Теперь рассмотрим методику нахождения доверительного интер­вала по заданной доверительной вероятности для качественного Признака.

Пример. Выборочное обследование 900 человек, организованное до способу простого случайного повторного отбора,  показало,  что 18 человек не информированы о крупном событии в стране.  Для Доверительной  вероятности  0,95  нужно  найти  доверительный  интервал.      

Пользуясь   выражением   для   формулы   средней   ошибки   (см.

табл. 16)

получаем

 

Далее по табл. А приложения, как уже описывалось выше, для a/2 находим  Z= 1,96.

Теперь можно определить величину предельной ошибки (см табл. 16):

Таким образом, доверительные границы для доли не информированных в генеральной совокупности равны 0,02 ± 0,009,  или от 1,1 до 2,9%.

Приведем иллюстративный пример определения объема простой повторной случайной выборки. Как видно из формул, чтобы опре­делить объем (см. табл. 16), для его оценки необходимо знать дис­персии генеральной средней или хотя бы ее оценки.

Для применения соответствующей формулы необходимо оценить  значение дисперсии, что можно сделать (при отсутствии информа­ции о ней и о размахе значений признака в генеральной совокупно­сти) путем проведения одной-двух пилотажных (пробных) выборок.

Допустим, что в результате пилотажа выборочная оценка дис­персии равна 12,24. Определим каким должен быть объем выборки чтобы с вероятностью 0,95 предельное отклонение выборочной средней от генеральной не превышало одного экземпляра газет. При этих условиях получаем численность планируемой выборки

Таким образом, объем выборки должен составлять 24 человека.

 

3.               Систематическая и серийная выборки.

 

Систематический отбор.

В социологических исследованиях иногда применяется несколько, упрощенный вариант простого случайного отбора, который носит название систематического. Основа выборки для него характеризуется теми же требованиями, что и для простого  случайного отбора. Иными словами, основу выборки составляют раз­личные алфавитные списки, картотеки учреждений, домовые книги и т. п. При систематическом отборе выбор единиц наблюдения осу­ществляется через один и тот же интервал /г из исходного списка. Например, при А = 20 выбирается 3, 23, 43, 63 и т. д. единиц списка.

Таким образом, элементы выборочной, совокупности  однозначно определяются при систематическом отборе номером первого элемен­та (тройки в нашем примере) и величиной интервала А.

В одной из схем систематического отбора в качестве первого элемента выбирается средний элемент списка или стоящий рядом с ним. Так, если список генеральной совокупности пронумерован от 1 до N, то номер первого элемента может  быть  определен  по формулам (N+1)/2 если N—нечетное и N/2, если N- четное число.

Более распространен выбор первой единицы отбора случайным об­разом (например, по таблице случайных чисел).

Величина А зависит от характера поставленной проблемы, от разброса значений исследуемой характеристики генеральной сово­купности.

Если решен вопрос об объеме планируемой выборки, то число определяется, в зависимости от объема генеральной совокупности и объема выборки (и).       

Если N — кратное числа n, то интервал определяется по формуле k=N/n. Если N не кратно n, то реальный объем выборки np и  планируемый  объем nпл .при  различных  способах вычисления числа А связаны следующими соотношениями:

Здесь [ ] означает целую часть числа. Поясним сказанное на примере: пусть N=19 и n=5, чему равно k?  Тогда k равно либо 3, либо 4.

При k= 3 в выборку  попадает больше пяти элементов — в данном случае 6 пли 7. При k= 4 в выборку попадут пять или четыре элемента.

Расчет характеристик систематической выборки. В связи с тем что систематическая выборка определяется как разновидность про­стого случайного отбора, ее характеристики рассчитываются с по­мощью соответствующих формул табл. 16.

В примере с подписчиками газет и журналов (см. табл. 15) в систематическую выборку объемом 5 единиц попали номера респондентов 10, 20, 30, 40, 50, для которых соответствующее число вы­писываемых газет равно 3, 5, 5, .3, 2. Среднее по выборке равно 3,6, а дисперсия — 1,4.4 (s= 1,2).

Таким образом, с вероятностью 0,95 можно утверждать, что до­верительный интервал для генеральной средней имеет следующие границы: (3,6± 1,96-0,54) = (3,6 ±1,05) ==(2,55; 4,65).

Возможности и ограничения систематической выборки. Система­тическая выборка является экономным и удобным способом форми­рования выборочной совокупности. Однако при ее применении в социологических исследованиях необходимо следить за тем, чтобы список, используемый в качестве основы выборки, не обладал порядком, отражающим периодичность в значениях изучаемой харак­теристики.                                  Проиллюстрируем это положение. При составлении основы выборки для опроса рабочих в одном из цехов завода выбранный интервал может совпасть с числом рабочих в бригаде, в списке который первым окажется бригадир. При систематическом отборе повышаются шансы попадания в выборку только одних бригадиров. При такой реализации выборки повышается вероятность получения значительных систематических ошибок.

Предварительное расположение элементов генеральной совокуп­ности по убыванию или возрастанию исследуемой характеристики дозволит избавиться от этой опасности. Так, если в рассмотренном примере основа выборки организуется на базе платежной ведомости,  в которой лица расположены в порядке возрастания их заработной платы, то опасность попадания только на одних бригадиров исклю­чается.

Систематическая выборка из-за простоты реализации  получила широкое применение в социологических исследованиях.

Серийная (гнездовая) выборка.

При серийной выборке единицы отбора представляют собой статистические серии, т. е. совокупности статистически различимых единиц. В качестве таких единиц могут выступать семья, бригада, школьный класс, небольшие производственные коллективы в учреждениях, почтовые отделения, врачеб­ные участки, населенные пункты, территориальные общности и т. п. Отобранные в выборку серии подвергаются сплошному или выборочному обследованию. Второй вариант используется в практике социологических Исследований гораздо чаще, чем первый. Собствен­но говоря, любая многоступенчатая выборка представляет собой гнездовую выборку, в которой единицы отбора на высших ступенях являются гнездами из единиц отбора нижних ступеней.

Организация серийной выборки. Серийная выборка имеет суще­ственные организационные преимущества перед простой случайной выборкой, так как значительно легче произвести отбор и изучение нескольких коллективов, бригад, цехов и т. д., находящихся на одном месте, чем нескольких сотен пространственно разбросанных людей. Процедура отбора позволяет сконцентрировать выборку в сравнительно небольшом числе пунктов.

Серийная выборка может организовываться по схемам простой случайной и систематической выборок. Наконец, она может форми­роваться после предварительного районирования генеральной сово­купности.

В первых двух случаях к информации о генеральной совокупно­сти— основе выборки—предъявляются те же требования, что и ко всем вероятностным выборкам: размещение элементов генеральной совокупности (серий) не должно быть каким-либо образом система­тизировано.

Метод маршрутного опроса. Этот метод социологи часто используют, когда единицей наблюдения выступает семья.

В выборочную совокупность, например намечено включить определенное число случайно отобранных семей или квартир. На карте города или населенного пункта нумеруются все улицы. С помощью таблицы случайных чисел отбираются большие числа, которые поз­воляют идентифицировать семьи или квартиры, попавшие в выбор­ку. Каждое большое число рассматривается как состоящее из трех компонентов: первые две или три цифры в нем указывают номер улицы, следующая цифра — номер дома, последняя цифра — номер квартиры в выбранном доме.

Например, число 42—25—3 указывает квартиру № 3 дома № 25 на 42-й улице.

Организация серийной выборки методом маршрутного опроса наиболее приспособлена к городам, где преобладают отдельные квартиры, или к населенным пунктам, где еще сохраняется частное домовладение (в последнем случае отпадает необходимость выбирать номер квартиры).

Возможности и ограничения серийной выборки. При серийной выборке всегда имеет место занижение по сравнению с генеральной совокупностью дисперсии изучаемого признака в силу определен­ного сходства единиц в сериях.

Например, вполне объяснима заметная связь между членами семьи. Характер профессий детей в определенной мере может зави­деть от профессии родителей. Очевидна связь членов семьи в отно­шении их социальной принадлежности.

С точки зрения статистика, сходство элементов серий приводит к избыточности однотипной, повторяющейся информации. Социолог должен учитывать этот органически присущий серийной выборке статистический порок при прочих равных условиях, выбирая в ка­честве гнезд такие общности, которые содержат максимально разно­родные конечные единицы наблюдения. Так, при изучении, ска­жем, качества медицинского обслуживания населения города разум­но в виде гнезд выбрать совокупность жителей, обслуживаемых отдельными почтовыми отделениями, или проживающих на терри­тории отдельных жэков, но никак не врачебные участки, поскольку последний выбор привел бы к искажению результатов.

Расчет характеристик серийной выборки. Расчет характеристик серийной выборки имеет некоторое отличие от простой случайной и систематической выборок. Это отличие связано прежде всего с вычислением дисперсий и ошибки выборки.

Вычисление средней ошибки серийной выборки основано на дис­персии серийных средних.

Пример. И генеральной совокупности, включающей 16 семей, сделана серийная выборка, состоящая из четырех семей (в каждой семье по 4 человека). Перед исследователями стоит задача найти оценку средней заработной платы в генеральной совокупности, оцен­ку ее дисперсии и среднюю ошибку выборки (табл. 18).

Средняя ошибка бесповторной серийной выборки определяется

 

 

 

Расчет дисперсии серийных средних

 

 

Тогда

 

 

 

В зависимости от выбранной доверительной вероятности средняя заработная плата для генеральной совокупности 83,5 ± 21,53.-На­пример, исследователь может с вероятностью в 0,95 утверждать, что в данной генеральной, совокупности средняя заработная плата не меньше 80,6 руб. и не больше 86,5 руб.

Так как вычисление ошибки для серийной выборки основано на дисперсии серийных средних, то серийный отбор будет тем репре­зентативнее, чем меньше степень колеблемости серийных средних, измеряемая величиной их дисперсии.

 

4.               Стратифицированный отбор

 

Понятие стратифицированной выборки.

Вероятностная выборка с любой техникой отбора (простая случайная, систематическая, серийная или многоступенчатая) становится стратифицированной, если процедурам отбора предшествует выделение в генеральной со­вокупности однородных частей, называемых стратами,

В статистическом смысле стратификация соответствует выделе­нию таких статистически однородных групп, колеблемость изучае­мых признаков которых внутри меньше, чем между ними.

Эта дифференциация внутри генеральной совокупности на ка­чественно более однородные группы содержательно связана  пред­метом исследования.

Стратификация совокупности оказывается необходимой во всех случаях когда совокупность является неоднородной по социальным, экономическим и другим характеристикам единиц наблюдения.

Так исследуя профессиональную ориентацию школьников в пределах одного города, можно в одну страту отнести 16 школ расположенных в районе старых застроек, во-вторую-20 школ, расположенных а районах новостроек. Для опроса можно выбрать вы­пускников из двух школ первой страты, а также из •двух школ второй страты. Если такая группировка школ действительно отражает различия районов которые существенно учитывать исследо­вании профессиональной структуры, то, колеблемость изучаемых признаков внутри каждой группы школ должна быть меньше, чем между группами.

В качестве страт могут быть использованы как  естественные обрывания,  так и специально   формируемые  для  определенного исследования. Например, такими стратами могут выступать мико-географические регионы или области страны, города, классифицированные их административному статусу и по численности населения.  Стратами  могут  выступать, и  идеальные  образования. Примером является выделение в генеральной совокупности при ис­следовании отношений молодежи к труду шести групп   по   содержанию5.

Стратифицирующий признак. Признак, по значениям которого производится стратификация генеральной совокупности, называется признаком стратификации. Стратификация может проводиться по одному или  нескольким признакам.

Организация  стратифицированной  выборки.

Организация стра­тифицированной выборки требует представления о характере распределения по всей совокупности тех признаков, которые должны быть положены в основу образования типических групп страт. Неправильный выбор признака для группировки элементов генеральной  совокупности  может  не  увеличить  репрезентативность    выборочных данных по сравнению со случайной выборкой того же   объема.

Организация   стратифицированной    репрезентативной   выборки связана на практике с известными трудностями,  особенно если вы­деленные страты неравночисленны. Математическая статистика рекомендует в этих случаях, чтобы размеры выборки из каждой страты были пропорциональны средним квадратическим отклонениям в соответствующих стратах генеральной совокупности. Но дисперсии,    как правило, неизвестны. Поэтому часто при организации отбора из страт генеральной совокупности производится отбор пропорциональ­но их размеру (доле) в общей численности совокупности.

Еще один употребляемый в социологии вариант выбора — это отбор одинакового количества единиц наблюдения из неравных ти­пических групп.

Выборка организуется в зависимости от рассмотренных вариан­тов отбора с объемом, который рассчитывается по следующим .формулам.

1. Пропорционально среднеквадратическому отклонению в  типической группе, найденному по результатам пробного исследо­вания. Размер (ni) выборки из i-й типической группы равен

 

где п — объем всей выборки; Ni=объем i-й группы в генеральной  совокупности; l— количество   групп.   Весь   объем  выборки   равен

 

 

 

 

 

 

Расчет характеристик стратифицированной выборки.

Характери­стики такой выборки рассчитываются как «взвешенные» величины: показатели по каждой страте комбинируются в общую среднюю; вклад групповых средних пропорционален «весу» каждой страты в выборочной или генеральной совокупности.

В стратифицированной выборке общая дисперсия выборки имеет как бы два источника: дисперсию групповых средних, которые характеризуют каждую страту sx2, и среднюю дисперсию из дисперсий внутри каждой из этих страт s2i. Первую составляющую принято называть межгрупповой дисперсией, а вторую — внутригрупповой дисперсией.

Это записывается следующим образом: s= sx2 + s2i                       (7)

Расчет средней ошибки при отборе, пропорциональном численности единиц в стратах,  производится по  формуле

 

 


 

или, если пренебречь отношением n/N,

 


 

В выражениях (8) и (9) s2i  вычисляется исходя из формулы (7), т. е. s2i=s2-s2x, где s2 — общая дисперсия выборки — подсчитывается как для простой выборки, не принимая во внимание страти­фикацию.


 

       Из соотношения для средней ошибки (7) следует, что ошибка стратифицированной выборки меньше средней ошибки чисто слу­чайной выборки либо равна ей, когда межгрупповая дисперсия равна нулю.

Пример. Предположим, что выборка содержит 5 страт (группы семей по среднему доходу6). Необходимо определить величину рас­ходов на годовую, подписку. Из каждой 2-й страты взяты по две семьи (объем выборки n = 10, см. табл. 19).


 

 

 


Таким образом, как видно из рассмотренного примера, страти­фицированная выборка при прочих равных условиях дает более точные результаты.

 

5.               Многоступенчатые и комбинированные способы, формирования выборочной совокупности

 

Выборка может   строиться   как   одно   или   многоступенчатая. При многоступенчатом отборе на каждой ступени меняется единица отбора. Например, на первой ступени производится отбор промышленных предприятий, на второй — отбор бригад на предприя­тиях, попавших в выборку на первой ступени, на третьей — отбор рабочих из бригад, попавших в выборку на второй ступени отбора, и т. д.

Необходимость многоступенчатого отбора вызвана, как правило, отсутствием информации о всех единицах генеральной совокупности. При многоступенчатом отборе для организации первой ступени не­обходимо иметь информацию о распределении' того или иного приз­нака по всей совокупности единиц отбора первой ступени. Для организации второй ступени нужна уже только информация об отобранных единицах первой ступени.

На первой ступени, как правило, используется случайный отбор, а, начиная со второй ступени случайно отбирается количество еди­ниц, пропорциональное размеру соответствующей единицы преды­дущей ступени и т. д.

Доли отбора на каждой ступени комбинируются таким образом, чтобы в целом доля отбора выборки обеспечивала всем единицам генеральной совокупности равные шансы попасть в выборку.

Пропорциональный способ организации многоступенчатой вы­борки имеет определенные неудобства. Социолог, с одной стороны, уменьшает объем выборки в целях экономии средств и сокращения сроков проведения исследования, а с другой,— соблюдая принцип пропорциональности, он может получить очень малочисленные группировки по отдельным факторам, которые окажутся недостаточ­ными для статистического анализа.

Существует несколько способов формирования многоступенчатых выборок.

Для примера рассмотрим способ организации двухступенчатой выборки, отбор единиц которой на первой ступени осуществляется с вероятностью, пропорциональной размеру. Воспользуемся для при­мера условиями и задачами организации выборки в известном ис­следовании ленинградских социологов.

Единицы первой ступени отбора — предприятия города.

Составляется полный список единиц наблюдений первой ступени отбора — промышленных предприятий и численности молодых рабочих на каждом из них. Генеральная совокупность включала 50 таких предприятий.

 

 

Единицы отбора ранжируются по численности рабочих, выделенных в качестве единиц наблюдения принимается решение о вклю­чении в выборку определенного числа заводов, например пяти. По таблице случайных чисел выбирается чисел (М1, М2, М3, М4 и М5)между N1 и N (общей кумулированной численностью рабочих в генеральной совокупности). В выборку включаются те предприятия, чьи номера  оказались в той же строке (j), которая соответствует кумуляте, содержащей одно из чисел Мk k=1/5 т. е. i = f, если N1+N2+…+Nj-1< Мk < N1, + N2 +…+ Nj по всем k.

Вторая ступень отбора реализуется следующим образом. На каждом предприятии, включенном в выборку; выбирается одно и то же число рабочих (единиц второй ступени отбора). Далее отбор может быть случайным или систематическим.

 Ошибка многоступенчатой выборки (на примере двухступенча­той выборки). При многоступенчатом отборе (начиная с двухсту­пенчатого) следует учитывать специфику расчета ошибки выборки. Каждая ступень отбора делает свой «вклад» в отклонение находи­мых оценок от истинных значений характеристик в генеральной совокупности.

Для достаточно большого объема выборки существуют упрощенные формулы расчета средней ошибки.

 

где s21 —дисперсия единиц первой ступени отбора и n1 —их числен­ность; n22 —дисперсия единиц второй ступени отбора и n2 — их численность в составе единиц первой ступени отбора в выборке.

В формуле учтены оба источника ошибок репрезентативности при двухступенчатом отборе. Первый член формулы под корнем указывает на дисперсию, вызванную формированием первой - ступе­ни отбора. Второй член указывает на внутригрупповую дисперсию, связанную с организацией второй ступени выборки.

Упрощенность этой формулы состоит в том, что внутригрупповые дисперсии рассчитываются внутри каждой единицы первой ступени после отбора из нее единиц второй ступени. Здесь указана «невзвешенная» средняя из квадратов ошибок по всей сумме единиц второй ступени (n2). Это второй источник случайных ошибок.

Многофазовый отбор.

Многофазовый отбор является особым ви­дом многоступенчатого отбора. Он заключаемся в том, что из сфор­мированной выборки большего объема производится новая выборка (подвыборка) меньшего объема и т. д.

Особенностью этого способа формирования выборочной совокуп­ности, является то, что независимо от числа фаз в последующих подвыборках используется неизменно одна и та же единица отбора, что и в основной выборке.        

К многофазовому отбору, прибегают тогда, когда в рамках ис-4 следования, которое проводится на большой выборке, возникает не­обходимость тщательного изучения более узкого круга вопросов. Для этих целей формируется вторая фаза — та же выборка в миниатю­ре и т. д.

Как и в многоступенчатых выборках, при многофазовом отборе каждая фаза является источником случайных ошибок.

Пример двухфазовой стратифицированной выборки7. В ходе ис­следования сельского населения возникла необходимость более углубленно изучить его культурные потребности и материальные затраты на «потребление культуры».

Основная выборка (n) была сделана из стратифицированной ге­неральной совокупности — изучаемый регион был разделен на 5 страт по типу хозяйств: от мелких (1) до самых крупных (5). Вто­рая фаза выборки (n2) была организована из этой основной..

 

При исчислении выборочных показателей по выборке необходимо учитывать оба компонента случайной ошибки (как и в случае двухступенчатого отбора), связанного со структурой выборки первой фазы (n) и второй фазы (nп).

Комбинированные выборки.

Соединение в многоступенчатой вы­борке различных приемов отбора (простого случайного, системати­ческого или серийного) делает выборку комбинированной.

Как уже указывалось, большинство используемых в современ­ных социологических исследованиях выборок являются комбиниро­ванными.

Одноступенчатая стратифицированная выборка.   Комбинированная одноступенчатая выборка использовалась социологами ИСИ АН СССР при формировании выборочной   совокупности для  изучения индивидуальной  производительности  труда  (индивидуальных  норм выработки) рабочих сдельщиков.

Пример. На основе предварительного анализа пилотажного мас­сива из шести возможных для формирования выборки признаков (возраст, образование, стаж по профессии и на данном заводе, заработная плата и квалификация) были выбраны два заработная плата и, стаж по профессии. Эти признаки обнаружили наибольшее влияние на изучаемый показатель — норму выработки8.

Генеральная совокупность была стратифицирована на 6 страт,   различающихся уровнем заработной платы.  

Отбор в стратах имел случайный характер — по распределению     второго по «весу» признака (стаж по профессии).

Были известны следующие данные по генеральной совокупности.   

 

где S2=m(1 — m), m-выборочная доля. Дисперсия качественного признака (выполнение нормы сдельщиками) при отсутствии информации была принята равной s2 = 0,5 • 0,5 =0,25. Доверительная ве­роятность 1 — a = 0,95; предельная ошибка репрезентативности D= 0,05.

В связи с тем что построение репрезентативной районированной выборки означает сохранение в выборке пропорции для групп ге­неральной совокупности, для определения размера групп выборочной

 


совокупности принимается следующий план9: ni/n=Ni/N, где N и n —
размеры соответственно генеральной совокупности и выборки; Ni и-
ni — размеры соответственно страт в генеральной и выборочной совокупностях. Рассчитывается численность каждой страты (представительство групп заработной платы) в выборке.

 

 

Пропорциональное построение выборки соответствовало следующим необходимым размерам групп:

Следующая стадия работы заключалась в расчете доли страт стажа. Для пропорционального построения выборки отбор по стажу следует согласовать с планом:

 

 

где Niqчисленность каждой страты по стажу в отдельной страте-
по уровню зарплаты в генеральной совокупности, niq— соответст­венно для выборки.     

Когда найдены эти доли для каждой страты по стажу, рассчитывается, сколько единиц наблюдения и с каким стажем должно
попасть из каждой такой страты в выборочную совокупность. На­
пример, доля для стажа 1—2 года и заработной платы 60—80 руб.
равна 0,60, а для стажа 3—4 года в той же типической группе до­
ля равна 0,40. Исходя из них, находим размер выборки для каждой
страты:                                                                        

 

 

Аналогичный расчет производится по всем остальным стратам» В результате формируется план пропорциональной выборки в абсо­лютных числах и процентах (табл. 20).

По таблице случайных чисел выбираются случайные числа в со­ответствии о размером каждой группы, представленной в выборке (табл. 20).          Предварительно картотека была стратифицирована по группам заработной платы и карточки пронумерованы. Из каждой группы выбирались карточки, соответствующие случайным числам. Если стаж на выбранной карточке должен был быть представлен в данной группы,  карточка отбиралась в выборку. Если стаж не должен был быть представлен в данной группе, карточка   возвращалась в генераль­ную совокупность.

Появление карточек, которые возвращались в массив, потребо­вало дополнительного выбора случайных чисел для каждой группы, пока не был обеспечен намеченный по плану размер. Как видно из

 

табл. 20, некоторые смещения оказались в группах с большим  стажем. Но выборка репрезентативна по контролируемому признаку —
средней норме выработки: в генеральной совокупности — 109%,
в выборке — 108,9%. Рассчитаем по  этой    выборке    оценку доли перевыполняющих  план выработки в генеральной совокупности10 (табл. 21).

 

Чтобы использовать показатель доли по выборке как оценку соответствующего параметра в генеральной совокупности, необхо­димо рассчитать среднюю ошибку выборки.

Расчет дисперсии доли в стратифицированной выборке произво­дится по формуле:

 

Расчет средней выборки производится по формуле:


 

При доверительной вероятности 0,95  предельная ошибка выборки D= ZM = 1,96 *0,0084 = 0,016, или 1,6%.           

Таким образом, с вероятностью 0,95 можно утверждать, что доля перевыполняющих план будет в интервале (81 ± 1,6) %.

 

6. Неслучайные методы отбора и другие подходы  к построению выборки

Выборочный метод в условиях недостатка информации о гене­ральной совокупности. Недостаток информации о, генеральной совокупности в той или иной форме    свойствен   любому выборочному исследованию (для восполнения недостатка оно и проводится).

Будем выделять два тина априорной информации о генеральной совокупности: а) есть перечень объектов генеральной совокупности и нет сведений о дисперсии изучаемой характеристики, б) нет пе­речня объектов генеральной совокупности.

В случае а) недостаток информации, как это уже отмечалось выше, преодолевается путем проведения одного-двух пробных ис­следований.

Для планирования пробных исследований можно рекомендовать использование таблицы достаточно больших чисел11.  Один, из  ва­риантов таких таблиц задает численность   выборки, рассчитанную на основе закона больших чисел безотносительно к объему генераль­ной совокупности. Если известен коэффициент вариаций генераль­ной совокупности, то объем выборки может быть определен по номо­граммам достаточно больших чисел.

Если генеральная совокупность позволяет найти размах колеба­ния признака, то естественно воспользоваться приближенным рас­четом дисперсии с помощью табл. 17.

Для расчетов по качественной характеристике проведение проб­ных исследований не является обязательным, так как можно поль­зоваться максимально возможным значением дисперсии s2 = 0,25, получаемой при равной доле наличия и отсутствия исследуемого признака. В таком случае планируемый объем выборки оказывается несколько завышенным для выбранного уровня доверительной ве­роятности.

Случай б) значительно затрудняет использование описанных ме­тодов  вероятностного отбора в социологических исследованиях. К настоящему времени наметились в социологии две тенденции в их преодолении.

Первая связана с применением более сложных схем случайного отбора стратифицированного, многоступенчатого, комбинированного (о чем речь шла в параграфах 4 и 5 настоящей главы). Вторая связана с отказом от строгого выполнения условий вероятностного отбора.

В социологии применяется ряд приемов формирования выборочных совокупностей, которые строятся по   подобию вероятностных, но для которых нельзя строго обосновать, что выборочные характеристики выступают оценками соответствующих характеристик генеральной совокупности. Такие выборки можно назвать эмпирическими, так как они ре имеют теоретического вероятностного обос­нования.

Стихийная выборка. Широко известна так называемая выборка «первого встречного», которая лишь на первый-взгляд кажется вероятностной. Социолог в этом случае может бессознательно руко­водствоваться при выборе лиц для опроса чувством личной симпа­тии или антипатии, соображениями удобства и т. п.

Выборку «первого встречного» и другие, ей подобные, принято называть не вероятностными, а стихийными. Эти способы организа­ции выборки характеризуются тем, что для них невозможно уточ­нить, какую генеральную совокупность они представляют.

Примером стихийных выборок являются опросы с помощью ра­дио или телеанкет, а также анкет, опубликованных в печати. Гене­ральной совокупностью каждый раз выступает аудитория, читатели того или иного-канала, массовой коммуникации. Однако из-за не­знания каких-либо характеристик этой генеральной совокупности, а чаще всего и ее размера невозможно определить качество вы­борки: достаточно хорошо она репрезентирует генеральную совокуп­ность или дает совершенно искаженную картину.

Примером стихийного    метода    формирования выборки может, служить процедура, разработанная сотрудниками ИСИ АН СССР для опроса посетителей международной выставки «Связь-81»12. Трудность построения' выборки заключалась в том, что было невоз­можно организовать точный счет посетителей, входящих на терри­торию и выходящих с территории выставки. Поэтому была предло­жена компромиссная процедура: несколько интервьюеров, стоящих на каждом входе и выходе выставки, независимо друг от друга начинали вести (со сдвигом во времени) счет посетителей — в выбор­ку отбирался десятый посетитель. Он опрашивался данным интер­вьюером, и затем этот же интервьюер вновь отбирал десятого посетителя по аналогичной процедуре. Поскольку опрос велся на входе и выходе с выставки, появилась возможность проверить репрезен­тативность результатов. Сопоставление социально-демографических показателей позволяет говорить о достаточной точности данной процедуры.

Квотная выборка. Наиболее распространенной из числа не строго случайных методик формирования выборочной совокупности явля­ется квотная выборка. Она строился как модель, воспроизводящая, структуру генеральной совокупности в виде квот (пропорций) рас­пределений изучаемых признаков или признаков, с ними взаимо­связанных. Число единиц (элементов выборочной совокупности) по различным сочетанием изучаемых признаков определяется с таким расчетом, чтобы оно соответствовало их доле (пропорции) в гене­ральной совокупности. Квотная выборка часто применяется в мас­совых опросах населения и особенно при изучении общественного мнения. На основании квотной выборки устанавливается, сколько лиц и с какими характеристиками следует опросить.

Применение квотной выборки в «Чистом виде» возможно при наличии на момент проведения опроса достаточно подробных сведений о генеральной совокупности. Формирование модели генеральной совокупности означает наличие информации о независимом распре­делении каждого из изучаемых признаков или об их условном распределении. Эта картина с учетом размера выборки должна быть воспроизведена в модели. Самым сложным моментом является (осо­бенно если необходима всесоюзная модель) географическое соотне­сение выборки, т. е. определение, какие конкретно населенные пункты включать в выборку.

Непосредственная реализация квотной выборки соответствует  организации опроса лиц согласно квотам. Существует два способа задания квот: 1) интервьюеру дается обязательный набор призна­ков, которым должен обладать каждый респондент, и. указывается общее число респондентов, подлежащих опросу; 2) задание ограни­чивается перечислением независимых характеристик контингента, подлежащего опросу в определенном населенном пункте.

Первый способ был использован советскими социологами в ис­следовании городских кинозрителей13. Например, задание для интер-

 


вьюера,   направленного   в   Магнитогорск,   предполагало   учитывать при опросе следующие признаки респондентов (табл. 22).

При втором способе это задание выглядело бы так: опросить 6 человек со следующими свободными параметрами:

 

Формирование модели для квотной выборки полностью соответствует условиям вероятностного отбора.

Отличие квотной выборки начинается со способа отбора респондентов, который содержит опасность систематических смещений. При выборе лиц для опроса интервьюеры на практике часто совер­шают ошибки типа «выбор себе подобных», В роли интервьюеров нередко выступают студенты, молодежь, неосознанно отдающие предпочтение тем, с кем им легче общаться. Поэтому в квотных вы­борках часто наблюдается завышение доли лиц с высшим образо­ванием и более молодых возрастных групп.

По некоторым литературным данным, при условии соблюдения оптимального объема квотной выборки ее точность конкурирует с точностью случайных выборок и даже может превышать послед­нюю14. Однако отсутствие теоретических гарантий точности выво­дов, полученных с помощью квотной выборки, снижает ее ценность. В связи с этим основное достоинство выборки состоит в простоте ее реализации, быстроте проведения.

Другие сложности и, проблемы построения выборки.

Если иссле­дуется генеральная совокупность по качественному признаку, име­ющему всего лишь две градации (да — нет; имею — не имею и т. п.), то возможно применение вышеизложенного аппарата статистических оценок. Но если качественный признак имеет несколько градаций или вообще не разработана его классификация?

 


В первом случае необходимо предварительно укрупнить имею­щиеся градации, сведя их к двум более широким классам. Напри­мер, если исследуется признак с тремя градациями: не выполнив­шие план, выполнившие план и перевыполнившие план, то инфор­мация собирается по признаку, измеренному по дихотомической шкале, скажем, в виде: не выполнившие план — одна градация и выполнившие и перевыполнившие план — другая.

Значительно сложнее обстоит дело, если качественный признак оказывается даже не измеренным по номинальной шкале. Напри­мер, как применить выборочный метод для исследования образа жизни, общепринятой типологии которого пока еще нет?

Выборку для исследования подобного вопроса нельзя организо­вать, не имея некоторых показателей, так или иначе связанных с исследуемой качественной характеристикой.

Иногда удается решить вопрос об использовании определенного показателя для организации выборки по качественному признаку путем разработки соответствующих исследовательских гипотез. На­пример, при исследовании кино аудитории социолог может выдви­нуть гипотезу о зависимости вкусов и предпочтений кинозрителя от его образования. Тогда, зная, что в исследуемой генеральной со­вокупности 15% лиц с высшим образованием, 40% со средним и 45% с неполным средним он должен выдержать эти пропорции в выборке. Если исследовательская гипотеза предполагает также, что вкусы кинозрителя зависят в среднем от его возраста, то в выборке должны быть пропорционально представлены те возрастные группы генеральной совокупности, которые интересуют исследователя.  Однако сравнительно редко удается ограничиться двумя-тремя показателями для адекватного представления качественной характе­ристики. Значительно чаще, прежде чем приступить к использова­нию выборочного метода (так же как и любого другого статисти­ческого наблюдения), необходимо разработать систему показателей, отражающих качественную характеристику.

Построение системы показателей— сложнейший с методической точки зрения этап всего социологического исследования. Сложность усугубляется отсутствием каких бы то ни было формальных  кри­териев для отбора показателей в систему, отражающую данную ка­чественную характеристику. Вопрос в каждом случае решается на основании тщательного содержательного рассмотрения проблемы социологического исследования.

Но трудности не заканчиваются с построением системы социаль­ных показателей для исследуемой качественной характеристики. Возникает вопрос о построении выборочной совокупности по разра­ботанной системе показателей.

Если количество показателей системы невелико, то в принципе возможно последовательное применение изложенного аппарата вы­борочного метода для одной переменной. Однако этот путь требует значительных усилий, так как приходится по-новому организовы­вать выборочную совокупность при переходе от одного показателя к другому.

Перспективным оказывается принципиально другой подход при планировании выборочной совокупности, основанный на примене­нии всей разработанной системы показателей одновременно. Особен­но эффективным он оказывается, когда число показателей системы велико. А именно этот случай весьма характерен для многих социо­логических исследований.

Описываемый подход реализуется в социологических исследова­ниях с помощью того или иного метода многомерного анализа эм­пирических данных. Его сущность состоит в предварительной стра­тификации всей генеральной совокупности по всей системе показа­телей. Здесь приобретают важное значение различные методы авто­матической классификации, например таксономия, метод структурной классификации, а также причинный анализ и методы многомер­ной статистики15.

Организацию выборочного исследования с применением методов многомерного анализа социологу целесообразно проводить в тесном контакте, со специалистом по многомерной статистике. Все усилия, затраченные социологом при подготовительной работе при органи­зации выборочной совокупности по системе показателей с помощью многомерных методов, окупятся на стадии сбора социологической информации по рассчитанной таким образом выборке и анализу их результатов.

Литература для дополнительного чтения

Введение в теорию порядковых статистик/Под ред. А. Я. Боярского. М. Ста­тистика, 1970. 414 с.

Венецкий И. Г.. Теоретические и практические основы выборочного метода Учеб. пособие. М.: МЭСИ, 1975. 67 с. -

Вороное Ю. П. Распознавание образов и выборка в социологических иссле­дованиях.— В кн.: Социология и математика. Новосибирск: Наука. Сиб. отд-ние, 1970, с. 69—76.

Горяченко Ё. Е. Планирование выборки для комплексного социально-экономи­ческого изучения деревни— Социол. исслед., 1975, № 3, с. 45—52.

Дружинин Н. К. Выборочное наблюдение и эксперимент: Общие логические принципы организации. М.: Статистика, 1977. 176 с.

Йейтс Ф. Выборочный метод в переписях и обследованиях. M. Статистика, 1965. 434 с.

Кокрен У. Методы выборочного  исследования.  М.:  Статистика,  1976. 440  с.

Королев Ю. Г. Выборочный метод в социологии: Учеб. пособие. М.: МЭСИ, 1975. 66 с.

Ноэль Э. Массовые, опросы. М.: Прогресс, 1978. Гл. 3. 381 с.

Проектирование и организация выборочного социологического исследования, М.: ИСИ АН СССР, 1977. 167 с. Ротапринт.

Процесс социального исследования. М.: Прогресс, 1975. Разд. I, § 3.2.

Райх А., Волков А. О методе распространения выборочных данных Всесоюз­ной переписи населения.— Вести, статистики, 1980,.№ 3, с. 19—31,

Территориальная выборка в социологических исследованиях. М.: Наука; 1978. 218с.

Чернышева Т. М. О повышении точности оценки результатов выборочных обследований.— В кн.: Опыт применения прикладных методов математики и вычислительной техники в народном хозяйстве. М.:  Статистика. 1978. е. Ш-188.

Шереги Ф. 9. Методические проблемы выборки и репрезентативности в социологической практике.— Социол. исслед., 1977, № 1, с, 112—122. 

» Нет комментариев
Пока комментариев нет
» Написать комментарий
Email (не публикуется)
Имя
Фамилия
Комментарий
 осталось символов
Captcha Image Regenerate code when it's unreadable
 
« Пред.   След. »