РАБОЧАЯ КНИГА СОЦИОЛОГА II-VI глава

12.12.2006 г.

Оглавление
РАБОЧАЯ КНИГА СОЦИОЛОГА II-VI глава
Страница 2
Страница 3
Страница 4
Страница 5
Страница 6

Страница 6 из 6

Глава шестая

Выборочный метод в социологическом исследовании

В марксистской социологии имеются давние традиции по применению методов статистического наблюдения. В настоящее время без них практически немыслимо проведение эмпирических социологических исследований.

В целом эти методы могут быть разделены на сплошные и не сплошные. Сплошное статистическое наблюдение требует полного охвата объекта исследования, всех его элементов без исключения.

Сплошное исследование некоторых социальных объектов по многим причинам может оказаться или очень трудоемким, или требующим больших денежных затрат, или просто невозможным. В этих случаях используются методы не сплошного наблюдения, которые очень хорошо себя зарекомендовали в различных областях науки и техники.

Строгому научно обоснованному выбору части социальных объектов как методу исследования всей совокупности большое значение придавал В. И. Ленин. Он предлагал провести выборку «для изучения небольшого числа типичных предприятий (фабрик, совхозов) и учреждений (a) наилучших, образцовых; (b) средних и (g) наихудших»1.

Наиболее часто в социологии используются три метода несплошного наблюдения: 1. Монографический, 2. Метод основного массива, 3. Выборочный.

Монографический метод, строго говоря, выходит за рамки чисто статистического наблюдения, ибо наряду с фиксацией статистических данных предполагает детальное качественное описание массовых явлений. Выбираемая для монографического исследования часть объекта очень часто является типичной, в определенном смысле, для всего объекта или для важнейших его элементов.

Именно эта особенность, дающая возможность глубокого проникновения в сущность изучаемых массовых явлений, представляет важнейшее достоинство монографического метода, который, как правило, применяется в социологии в комбинации со сплошным или различными видами не сплошпого исследования.

Известно, например, какую роль В. И. Ленин отводил монографическому методу наблюдения за состоянием сельского хозяйства в нашей стране в целях его скорейшего подъема. В. И. Ленин выделял три группы крестьянских хозяйств по уровню их развития: «...поставленные заведомо хорошо, сносно и неудовлетворительно. Одно типичное хозяйство каждой из этих последних трех групп должно быть не менее двух раз в год описываемо подробно с точным указанием всех данных об описываемом хозяйстве...»2.

Значение монографического метода не ограничивается применением лишь к типичным объектам социологического исследования. Он оказывается весьма полезным при изучении объектов в социальном эксперименте, когда зарождается передовой опыт, намечаются ростки прогрессивных явлений.

Методом основного массива, как правило, изучается большая часть объекта социологического исследования или его важнейшие элементы. Этот метод находит применение, например, в некоторых социологических исследованиях, проводимых с помощью контент-анализа.

Разновидностью метода основного массива являются экспертные опросы, так как при организации таких опросов стараются привлечь большую часть наиболее компетентных экспертов.

Наиболее широкое распространение в социологических исследованиях получил выборочный метод. В этой главе подробно рассматривается суть этого метода и основные процедуры его применения в социологии.

1. Основные понятия выборочного метода

Генеральная и выборочная совокупности.

Множество социальных объектов, которые являются предметом изучения в пределах, очерченных программой социологического исследования и территориально-временными границами, образует генеральную совокупность.

Любую генеральную совокупность характеризует некоторый явно задаваемый признак (или набор признаков), по значению которого всегда можно однозначно определить, относится данный объект к генеральной совокупности или нет. Так, в качестве генеральной совокупности мы можем рассматривать жителей данного города, промышленно-производственный персонал предприятия, студентов всей страны и т. п. Часть объектов генеральной совокупности, выступающих в качестве объектов наблюдения, называется выборочной совокупностью. Иными словами, если генеральная совокупность включает все без исключения единицы, составляющие объект исследования, то выборочная совокупность представляет собой специальным образом отобранную часть генеральной совокупности. При этом статистическое наблюдение осуществляется именно за элементами выборочной совокупности.

Внимательный читатель может заметить, что метод основного массива и метод монографического исследования также предполагают статистическое наблюдение некоторой части исследуемой совокупности. В чем же характерный признак выборки? Выборочная совокупность обычно конструируется таким образом, чтобы при минимуме исследуемых объектов удавалось с необходимой степенью гарантии представить всю генеральную совокупность.

Единица отбора и единица наблюдения.

Единицей отбора называют элементы генеральной совокупности, которые выступают единицами, счета в различных процедурах отбора, формирующих выборку.

Единицами наблюдения называют элементы сформированной выборочной совокупности, которые непосредственно подвергаются статистическому наблюдению. Единица отбора и единица наблюдения представляют собой социальные объекты, обладающие характеристиками, существенными для предмета конкретного социологического исследования. Они могут совпадать (в простых схемах отбора) и различаться (при сложных комбинированных схемах отбора).

Систематические и случайные ошибки статистического наблюдения. При получении социальной информации выборочным методом могут возникать ошибки различного рода. Причинами могут быть неточность данных, сообщенных социологу респондентом, неправильная фиксация получаемых сведений или неправильное измерение переменных, характеризующих единицы наблюдения, и т. д. Эти ошибки, называемые иногда ошибками регистрации, могут быть разделены на два типа: случайные и систематические.

Систематической ошибкой регистрации называется ошибка, выражающая некоторые существенные связи, возникающие в процессе регистрации между объектом, субъектом и условиями проведения наблюдения. Систематическая ошибка может быть значительной по - своей величине из-за одностороннего искажения (в сторону увеличения или уменьшения) исследуемой характеристики. Происходящее вследствие этого накопление ошибки по исследуемой совокупности в целом может зачеркнуть результаты всего исследования.

Систематическая ошибка регистрации может возникнуть при любом типе статистического наблюдения, в той числе и при проведении выборочного или сплошного обследования.

Характерным примером систематической ошибки являются данные о женатых мужчинах и замужних женщинах во Всесоюзной переписи 1970 г. По результатам переписи в целом по Союзу оказалось 53,0 млн. женатых мужчин и 54,2 млн. замужних женщин. Систематическая ошибка, зафиксированная в этой переписи, образовалась из-за погрешностей в ответах, возникающих от различной оценки своего семейного положения мужчинами и женщинами.

Случайные ошибки регистрации отражают менее существенные связи между объектом, субъектом и условиями регистрации и складываются из различных статистических погрешностей в процессе наблюдения. Погрешности, имея различную направленность в отдельных единицах наблюдения, проявляют тенденцию к взаимному погашению при обобщении результатов регистрации по всей исследуемой совокупности.

Таким образом, в отличие от систематической случайная ошибка вызывается при наблюдении причинами, носящими вероятностный характер.

Типичные ошибки выборочного социологического исследования. Ошибки регистрации встречаются при любом типе статистического наблюдения и, следовательно, свойственны и выборочному методу исследования.

Кроме того, в выборочном исследовании могут появиться ошибки, возникающие при различных отклонениях от планируемой выборки. Можно выделить два наиболее типичных вида отклонения от плана выборки.

1. Замена намеченных при планировании выборки единиц наблюдения другими, более доступными, которые, однако, оказываются неполноценными с точки зрения выработанного плана выборки.

Такого рода ошибки могут возникать при использовании недостаточно квалифицированных интервьюеров. Например, опрос планируется провести в каждой десятой квартире жилого массива. Никого не застав в выбранных квартирах, интервьюер иногда обращается в соседние квартиры и берет интервью. В итоге в выборке, оказывается значительная доля пенсионеров, больших по размеру семей и слабо представлены одинокие лица и малочисленные семьи. Ошибок этого типа (ошибок подстановки) можно избежать, контролируя деятельность анкетеров и интервьюеров и Качество собранной ими информации. В противном случае они могут привести к серьезным Систематическим ошибкам. .

2. Неполный охват выборочной совокупности, т. е. неполучение информации от части единиц наблюдения, включенных в выборку (например, недополучение почтовых анкет, не полностью заполненные анкеты).

Эти ошибки устанавливаются путем сравнения реально сформированной выборки с ее планом. Ошибки подобного рода «снимаются» так называемой процедурой «корректировки» выборки, т. е. путем специального пересчета значений изучаемого признака с учетом того, какая именно часть выборочной совокупности выпала из обследования.

Распространенными ошибками в выборочном социологическом исследовании являются ошибки, возникающие при неправильной разработке плана выборки. Только правильно намеченный и, конечно, реализованный план формирования выборочной совокупности может дать определенные гарантии для распространения выводов, полученных по выборке, на всю генеральную совокупность.

Во многих книгах в качестве примера смещения, возникающего из-за неправильного планирования выборки, приводится известный опрос, проведенный «Литэрари Дайджест» («Литературное обозрение») относительно исхода президентских выборов 1936 г. в США.

Кандидатами на этих выборах были Ф. Д. Рузвельт и А. М. Лан-дон. Редакция журнала организовала план выборки следующим образом. В выборку попали более двух миллионов американцев, выбранных при помощи случайного отбора из списков, имеющихся в телефонных книгах. По всей стране попавшим в выборку лицам были разосланы открытки с просьбой назвать фамилию будущего президента. Затратив огромную сумму на рассылку, сбор и обработку полученных открыток, журнал информировал общественность, что на предстоящих выборах президентом США с большим перевесом будет избран А. М. Ландон. Результаты выборов опровергли этот прогноз.

В то же время социологи Д. Гэллап и Э. Роупер правильно предсказали победу Ф. Д. Рузвельта, основываясь только на четырех тысячах анкет.

Ошибочный прогноз относительно возможного президента объясняется неправильным планом выборки, который не обеспечил полного отражения в ней всей генеральной совокупности: в телефонных книгах, которые использовались для организации выборки, были представлены лишь наиболее обеспеченные слои американского населения, в частности домовладельцы. Поскольку обеспеченные слои американцев составляют меньшую часть генеральной совокупности, то распространение мнения этой части населения на всю страну в целом оказалось ошибочным.

Ошибки часто возникают и в тех случаях, когда в выборочную совокупность преимущественно попадают представители одинаковых социальных групп. Так, почтовые анкеты чаще заполняют лица с более высоким уровнем образования, причем мужчины чаще, чем женщины, пенсионеры чаще, чем работающие и т. д.

Социолог самое пристальное внимание должен уделять анализу возможностей возникновения ошибок смещения в выборочных социологических исследованиях.

Репрезентативность выборки. Выборка в определенном смысле должна быть моделью генеральной совокупности, что и позволяет на ее основе оценивать характеристики этой совокупности. Однако нет необходимости моделировать в выборке все аспекты генеральной совокупности, достаточно лишь значимых с точки зрения задач исследования. Свойство выборки отражать, моделировать эти характеристики будем называть репрезентативностью.

Основной принцип построения выборки (точнее, вероятностного отбора) состоит в том, чтобы обеспечить всем элементам генеральной совокупности равные шансы попасть в выборку. Однако даже самое аккуратное соблюдение этого принципа не гарантирует выборку от искажений. Эти искажения — случайные ошибки — внутренне присущи выборочному методу. Они появляются в результате того, что обследуются не все единицы совокупности, а только выборка, и, следовательно, результат будет неточен, так как единицы совокупности не тождественны между собой. Значение случайной ошибки можно сравнительно легко вычислить, используя аппарат, разработанный в статистической теории выборочного метода. Таким образом, репрезентативность выборки будет определяться двумя компонентами: ошибками регистрации и случайными ошибками.

В идеальной ситуации в сплошном исследовании отсутствуют

ошибки репрезентативности, благодаря чему при правильной организации наблюдения ошибка выборочного исследования больше ошибки наблюдения при сплошном обследовании. Однако в социологии применение сплошного обследования требует значительного числа анкетеров и интервьюеров, а это ведет к тому, что иногда привлекаются недостаточно квалифицированные кадры, участие которых в исследовании увеличивает ошибку регистрации. И наоборот, применение выборочного исследования при решении тех же вопросов позволяет использовать более подготовленные кадры специалистов, обеспечить лучший их инструктаж, контроль за его выполнением. Это ведет к уменьшению ошибки регистрации. И если случайная ошибка не велика, то ошибка выборочного наблюдения в целом может оказаться меньше ошибки сплошного исследования. Таким образом, при определенных условиях выборочный метод оказывается более точным, чем сплошной, что еще раз подчеркивает его преимущество при организации и проведении эмпирических социологических исследований.

2. Простой случайный отбор

Основа выборки. Для организации простых схем отбора (простой случайной, систематической или серийной выборок) необходима информация обо всех элементах генеральной совокупности или хотя бы их перечень.

Основой выборки называют перечень элементов генеральной совокупности, если он удовлетворяет требованиям полноты, точности, адекватности, удобства работы с ним, отсутствия дублирования единиц наблюдения. Основой могут служить алфавитные списки сотрудников учреждения, номера пропусков, по которым можно идентифицировать определенные единицы, и т. п.

Полнота. Под полнотой подразумевается представленность всех единиц данной генеральной совокупности в основе выборки. Если некоторые единицы, которые по предположению должны быть в списке, не зарегистрированы в нем, то список является неполным.

Неполнота основы выборки приводит к серьезным ошибкам в том случае если не включенные в выборочную совокупность единицы наблюдения имеют существенные особенности и их достаточно много.

Отсутствие дублирования. Если некоторые единицы наблюдения генеральной совокупности будут включены в основу выборки более чем один раз, то они могут повторяться и в выборке (например, в том случае, когда человек переезжает из одного района в другой и включается в новый список раньше, чем исключается из старого).

Точность. Информация о каждой единице отбора должна быть точной. Основа выборки не должна содержать несуществующих единиц. Подобные неточности встречаются в избирательных списках, когда отсутствуют вновь прибывшие в данный населенный пункт, или остаются лица, изменившие свое местожительство, умершие, жильцы снесенных домов и т. п.

Адекватность. Основа выборки, адекватная для решения одних задач, может быть неадекватной для других. Например, полный список работников промышленного предприятия может быть хорошей основой для формирования выборочной совокупности при исследовании проблем удовлетворенности трудом работников данного предприятия, уровня их социальной активности и т. д. Но если изучается удовлетворенность трудом или социальная активность и т. д. не всех работников предприятия, а только молодёжи; то этот полный, список может послужить лишь для формирования новой основы выборки — списка молодежи.

Если основа охватывает не все социальные объекты генеральной совокупности, то она может использоваться как основа выборки для той части генеральной совокупности, которая представлена полностью, а выбор единиц наблюдения из остальной части следует организовать по другим источникам.

Удобство. Удобство работы с основой выборки — существенное условие повышения качества результатов. Удобно, когда единицы составляющие основу выборки, пронумерованы, когда имеющиеся сведения о них дают возможность с полной определенностью опознавать эти единицы. Если основа выборки находится в одном централизованном месте и ее структура соответствует реальной структуре изучаемых социальных объектов, это не только облегчает работу социолога, но и является необходимым требованием к исследованию, значительно повышающим его качество.

Одной из причин возникновения сложных схем выборки (многоступенчатых, комбинированных и т. п.) является невозможность обеспечить основу выборки для очень больших, генеральных совокупностей, обладающих сложной структурой.

К настоящему времени сложились представления об основе, которая могла бы удовлетворить требованиям организаций современных социологических исследований, быть действенной для различного типа исследований. Такой основой является социальная карта.

Социальная карта. Подобно тому, как географическая карта является ориентиром в пространственном движении, социальная карта должна стать ориентиром в исследовании социальных объектов. Социальная карта представляет собой пространственное распределение всевозможных социальных показателей для определенных экономико-географических регионов. Такая карта может служить основой всех выборочных исследований в каждом регионе, области,, районе, городе и т. п.

Процесс составления социальной карты складывается из следующих этапов.

1. Сбор информации о размещении и движении населения, об основных постоянных и сезонных потоках населения, которые выражаются в демографических показателях.

2. Сбор социально-экономической информации относительно профессионального состава населения: данные о квалификации, заработной плате, соотношения между работающими и неработающими, распределение уровня семейных доходов и т. д.

3. Сбор социологической информации: условия труда и быта; данные о проведении досуга, о его структуре по различным социальным группам; данные о различных формах социальной активности, образовательном уровне, средствах массовой коммуникации, об активности партийных и общественных организаций и т. д.

Возрастающий интерес социологов к построению социальных карт связан в значительной степени с прикладными задачами выборочного обследования. Для более углубленной разработки социальных проблем необходима и более основательная исходная социальная информация: карта размещения социальных групп, распространенности средств массовых коммуникаций и т. д., т. е. социальная карта.

Процедура простого случайного отбора.

По сформированной основе выборки легко реализовать процедуру простого случайного отбора. Для этого требуется соблюдение равенства шансов попадания единиц отбора в выборочную совокупность. Выделяют: а) простой случайный бесповторный отбор и б) простой случайный повторный отбор.

Осуществляться каждая из разновидностей процедуры может различными способами. Опишем один из них. Пусть основа выборки содержит N единиц. Тогда, чтобы выбрать п единиц наблюдения в выборочную совокупность, напишем все номера от 1 до N на отдельныe карточки, тщательно их перемешаем и наугад вынем одну из них. Номер вытащенной карточки задает соответствующую единицу наблюдения, попавшую в выборочную совокупность. Затем карточка возвращается на место, они снова перемешиваются, наугад, вынимается новая карточка, и так далее продолжается п раз. Так реализуется процедура простого случайного повторного отбора. Если извлеченную карточку не возвращать назад, а откладывать в сторону, то тот же процесс приведет нас к простой случайно бесповторной выборке размером в п единиц наблюдения или, как ещеговорят, объемом в n единиц.

Описанная процедура простого, случайного отбора становится чрезвычайно трудоемкой, если число N, задающее объем основы выборки, велико. Главная трудность состоит в том, что обеспечение равной вероятности попадания единицы наблюдения в выборочную совокупность требует очень тщательного перемешивания.

Чтобы устранить трудности, возникающие при исследовании больших генеральных совокупностей (а именно таких большинство в социологии), для реализацию простого случайного отбора пользуются так называемыми таблицами случайных чисел. Они содержат те или иные случайные цифры, полученные путем реализации некоторого физического случайного процесса, В литературе приводятся различные последовательности случайных -чисел объемом от нескольких десятков до миллиона цифр (табл. 14).

Продемонстрируем, как работать с таблицей случайных чисел, на гипотетическом примере, когда из совокупности заранее пронумерованных 300 единиц необходимо выбрать 7 единиц наблюдения. Поскольку N= 300 — трехзначное число, а в табл. 14 даны пятизначные числа, будем использовать только три последних цифры каждого числа.

Начиная с первого числа, двигаясь по строке, получим первый номер 97. Числа более 300 пропускаем и, продолжая этот процесс далее, получим ряд чисел: 296, 209, 13, 157, 147, 32.

Это и есть номера единиц наблюдения, попавших в формируемую выборку.

При организации бесповторного отбора приходится пропускать и числа (если они попадаются), которые встречаются второй раз в этом ряду.

Начинать процесс выбора случайных чисел можно с любого места таблицы и вести его в любом направлении (по строкам, столбцам и т. п.) или выбирая только определенные столбцы. Если имеющиеся под рукой таблицы достаточно длинны, то при решении очередной задачи выбора рекомендуется начинать с нового места таблицы.

Расчет характеристик простой случайной выборки.

Цель любого выборочного исследования состоит в том, чтобы, сформировав выборку, собрать по ней информацию и на основе этой информации оценить искомые характеристики генеральной совокупности.

Наиболее распространенной в социологических исследованиях задачей является оценка среднего значения признака (или доли в случае качественного признака) в генеральной совокупности.

Проиллюстрируем на примере нахождение выборочной оценки среднего генеральной совокупности. Предположим, что оценивается среднее число газет и общественно-политических журналов, выписываемых сотрудниками некоторого производственного коллектива. Рассмотрим по порядку все необходимые операции и их результаты.

Составляется основа выборки, т. е. список всех единиц отбора. В качестве такой основы может быть взят алфавитный список всех сотрудников, пронумерованных последовательно (табл. 15). В целях наглядности вместе с основой выборки приводятся и все истинные значения единиц отбора, еще неизвестные исследователю. В дальнейшем сопоставим истинное значение искомого параметра и выборочную оценку.

Общая сумма выписываемых газет и журналов равна 150. Среднее число выписываемых газет и журналов на каждого сотрудника равно = 150/50 = 3.

Среднее квадратическое отклонение для генеральной совокупности равно

Сумма квадратов отклонений равна 146 при условии, что одно значение квадрата отклонения, а именно от единицы отбора 28, было исключено из суммы. Это значение, равное 49, резко увеличивает сумму, будучи нетипичным для генеральной совокупности.

Такое «исключение» экстремального отклонения нередко применяется при обработке первичной социальной информации в том случае, когда предусмотрено возведение в квадрат, а само отклонение в 2—3 раза превышает среднее значение параметра.

Однако ни среднее значение параметра, ни среднее квадратическое отклонение перед началом исследования не известны. В противном случае само исследование было бы излишним.

Естественно предположить при анализе вышеприведенного примера, что каждый респондент (единица отбора и единица наблюдения) выписывает несколько газет и журналов и что количество выписываемых газет и журналов не слишком сильно варьирует (если бы путем выборочного исследования потребовалось определить, скажем, объем личных библиотек, положение исследователя осложнилось бы). Исходя из этих соображений, полагаем достаточной выборку, состоящую из пяти респондентов. Проверить правильность определения объема выборки можно только после обработки результатов пилотажного исследования.

Предположим, что случайный выбор из табл., 15 дал следующие результаты: выбраны номера 18, 4, 28, 39, 22; они соответствуют Значениям признаков 4, 0, 10, 4, 4.

Среднее арифметическое но выборке х = 22/5 = 4,4, дисперсия

Такое значительное отклонение от истинного значения средней объясняется тем, что в выборку попал респондент № 28, исключенный при подсчете дисперсии для генеральной совокупности как нетипичный. Однако при формировании выборки еще неизвестно, что данный респондент нетипичен. Но сам факт, что среднее квадратическое отклонение приближается по величине к средней, должен насторожить исследователей.

Для большей наглядности выразим s в процентах от величины средней: (3,5:4,4) • 100%= 79%, т. е. среднее отклонение значений признака от выборочной средней арифметической величины «оставляет 79%. В таких случаях целесообразно увеличить объем выборки, например, в 2 раза. В результате были отобраны номера: 44, 2, 12, 26, 14, 27, 35, 9, 8, 49; значения признака 5, 2, 4, б, 1, -3,2,5,3, 4.

Среднее арифметическое — 3,6, дисперсия s² = 2,26, среднее квадратическое отклонение s = 1,5. Теперь оно составляет приблизительно 40% от величины средней. При больших дисперсиях объем выборки увеличивают с учетом практических возможностей до тех пор, пока дисперсия не перестает уменьшаться. Дальнейшее увеличение объема выборки является нецелесообразным. Обычно исследователь приходит к некоторому компромиссному решению относительно объема выборки в зависимости от требуемой точности, а также средств и времени, которыми он располагает.

Сводка необходимых формул для простой случайной выборки. В рассмотренном гипотетическом примере легко было оценить качество выборочной оценки среднего (перед глазами была информация дня обо всей генеральной совокупности). Но как провести его оценку в реальном исследовании, когда имеется только информация, полученная из выборки?

На помощь приходит статистическая теория выборочного метода. Она позволяет при условии реализации случайного отбора достичь, по крайней мере, следующих двух целей:

1. По заданной априори необходимой степени точности выводов (формализуемой с помощью понятия доверительной вероятности) найти возможные интервалы, изменения характеристик генеральной; совокупности (доверительные интервалы). И наоборот, рассчитать доверительную вероятность отклонения характеристики генеральной совокупности от выборочной по заданной величине доверительного интервала.

2. Найти объем планируемой выборки, позволяющей достигнуть в пределах требуемой точности расчета выборочных характеристик необходимую доверительную вероятность.

Дадим сводку необходимых для достижения этих целей формул3. Чтобы уметь применять приведенные формулы при планировании выборки в эмпирическом социологическом исследовании, познакомимся несколько подробнее с основными понятиями выборочного метода— «доверительная вероятность» и «доверительный интервал».

Теоретико-вероятностные теоремы, восходящие к закону больших чисел, позволяют с определенной вероятностью, обозначаемой (1 —а), утверждать, что для изучаемого признака отклонения выборочной средней от генеральной не превысят некоторой величины D, называемой предельной ошибкой выборки.

В одной из формулировок это утверждение записывается следующим образом:

Смысл приведенного соотношения следующий: с доверительной вероятностью (1-a) можно утверждать, что генеральное среднее лежит в интервале

который и называется доверительным интервалом, а определяет как бы степень доверия к данным, получаемым по рассчитанным с его помощью выборочным характеристикам. Отсюда и название а — уровень значимости.

Принятие того или иного уровня значимости, например 5%-ного (a = 0,05), зависит от целей данного социологического исследования, требований к степени гарантии его результатов. Социолог должен четко понимать, что, выбрав, скажем, уровень значимости, равный 5 %, и, рассчитав на основе его выборочные характеристики, мы будем утверждать наличие некоторого эффекта, который на самом деле может оказаться несправедливым приблизительно в пяти процентах случаев.

Пример. При обследовании 900 человек — лиц трудоспособного возраста — определен их средний возраст. Для вероятности (1 — a) =0,90 необходимо найти доверительный интервал, в котором содержится генеральное среднее. Поскольку дисперсия признака неизвестна, оценим ее приблизительно по значению размаха для генеральной совокупности.

С этой целью воспользуемся соотношением связи среднего квадратичного отклонения с размахом

справедливым в предположении нормального характера распределения. Здесь Хmax — Хmin — вариационный размах генеральной совокупности, а V— величина, зависящая от объема выборки, значения которой можно найти в табл. 17.

Так как по всей генеральной совокупности верхняя граница трудоспособности в СССР — 60 лет, а нижняя — 16, то х_max — х_min =60—16 = 44, следовательно (для п> 100 — последний столбец

табл. 17), получим приближенное значение среднеквадратичного отклонения s=44:5= 8,8.

Величина Z находится по табл. А приложения при a/2. Таким образом, если 1 — a= 0,9, то Z = 1,64,

Подставляя найденные значения М и Z в формулу предельной ошибки, получаем D = ZM = 1,64 • 0,29 = 0,48.

Таким образом, округляя значение ошибки до половины года (0,5), можно утверждать, что с вероятностью 0,9 генеральное среднее не выйдет за пределы интервала х — 0,5 < М < х + 0,5, т. е. точность выборочной оценки среднего, рассчитанной по нашей выборке (если она организована методом простого случайного повторного отбора), оказывается равной половине года. Утверждать это мы можем с вероятностью 0,9. Интервал (х — 0,5, х + 0,5) и задает доверительный, интервагй, рассчитанный по доверительной вероятности, равной 0,9.

Теперь рассмотрим методику нахождения доверительного интервала по заданной доверительной вероятности для качественного Признака.

Пример. Выборочное обследование 900 человек, организованное до способу простого случайного повторного отбора, показало, что 18 человек не информированы о крупном событии в стране. Для Доверительной вероятности 0,95 нужно найти доверительный интервал.

Пользуясь выражением для формулы средней ошибки (см.

табл. 16)

получаем

Далее по табл. А приложения, как уже описывалось выше, для a/2 находим Z= 1,96.

Теперь можно определить величину предельной ошибки (см табл. 16):

Таким образом, доверительные границы для доли не информированных в генеральной совокупности равны 0,02 ± 0,009, или от 1,1 до 2,9%.

Приведем иллюстративный пример определения объема простой повторной случайной выборки. Как видно из формул, чтобы определить объем (см. табл. 16), для его оценки необходимо знать дисперсии генеральной средней или хотя бы ее оценки.

Для применения соответствующей формулы необходимо оценить значение дисперсии, что можно сделать (при отсутствии информации о ней и о размахе значений признака в генеральной совокупности) путем проведения одной-двух пилотажных (пробных) выборок.

Допустим, что в результате пилотажа выборочная оценка дисперсии равна 12,24. Определим каким должен быть объем выборки чтобы с вероятностью 0,95 предельное отклонение выборочной средней от генеральной не превышало одного экземпляра газет. При этих условиях получаем численность планируемой выборки

Таким образом, объем выборки должен составлять 24 человека.

3. Систематическая и серийная выборки.

Систематический отбор.

В социологических исследованиях иногда применяется несколько, упрощенный вариант простого случайного отбора, который носит название систематического. Основа выборки для него характеризуется теми же требованиями, что и для простого случайного отбора. Иными словами, основу выборки составляют различные алфавитные списки, картотеки учреждений, домовые книги и т. п. При систематическом отборе выбор единиц наблюдения осуществляется через один и тот же интервал /г из исходного списка. Например, при А = 20 выбирается 3, 23, 43, 63 и т. д. единиц списка.

Таким образом, элементы выборочной, совокупности однозначно определяются при систематическом отборе номером первого элемента (тройки в нашем примере) и величиной интервала А.

В одной из схем систематического отбора в качестве первого элемента выбирается средний элемент списка или стоящий рядом с ним. Так, если список генеральной совокупности пронумерован от 1 до N, то номер первого элемента может быть определен по формулам (N+1)/2 если N—нечетное и N/2, если N- четное число.

Более распространен выбор первой единицы отбора случайным образом (например, по таблице случайных чисел).

Величина А зависит от характера поставленной проблемы, от разброса значений исследуемой характеристики генеральной совокупности.

Если решен вопрос об объеме планируемой выборки, то число определяется, в зависимости от объема генеральной совокупности и объема выборки (и).

Если N — кратное числа n, то интервал определяется по формуле k=N/n. Если N не кратно n, то реальный объем выборки n_p и планируемый объем n_пл .при различных способах вычисления числа А связаны следующими соотношениями:

Здесь [ ] означает целую часть числа. Поясним сказанное на примере: пусть N=19 и n=5, чему равно k? Тогда k равно либо 3, либо 4.

При k= 3 в выборку попадает больше пяти элементов — в данном случае 6 пли 7. При k= 4 в выборку попадут пять или четыре элемента.

Расчет характеристик систематической выборки. В связи с тем что систематическая выборка определяется как разновидность простого случайного отбора, ее характеристики рассчитываются с помощью соответствующих формул табл. 16.

В примере с подписчиками газет и журналов (см. табл. 15) в систематическую выборку объемом 5 единиц попали номера респондентов 10, 20, 30, 40, 50, для которых соответствующее число выписываемых газет равно 3, 5, 5, .3, 2. Среднее по выборке равно 3,6, а дисперсия — 1,4.4 (s= 1,2).

Таким образом, с вероятностью 0,95 можно утверждать, что доверительный интервал для генеральной средней имеет следующие границы: (3,6± 1,96-0,54) = (3,6 ±1,05) ==(2,55; 4,65).

Возможности и ограничения систематической выборки. Систематическая выборка является экономным и удобным способом формирования выборочной совокупности. Однако при ее применении в социологических исследованиях необходимо следить за тем, чтобы список, используемый в качестве основы выборки, не обладал порядком, отражающим периодичность в значениях изучаемой характеристики. Проиллюстрируем это положение. При составлении основы выборки для опроса рабочих в одном из цехов завода выбранный интервал может совпасть с числом рабочих в бригаде, в списке который первым окажется бригадир. При систематическом отборе повышаются шансы попадания в выборку только одних бригадиров. При такой реализации выборки повышается вероятность получения значительных систематических ошибок.

Предварительное расположение элементов генеральной совокупности по убыванию или возрастанию исследуемой характеристики дозволит избавиться от этой опасности. Так, если в рассмотренном примере основа выборки организуется на базе платежной ведомости, в которой лица расположены в порядке возрастания их заработной платы, то опасность попадания только на одних бригадиров исключается.

Систематическая выборка из-за простоты реализации получила широкое применение в социологических исследованиях.

Серийная (гнездовая) выборка.

При серийной выборке единицы отбора представляют собой статистические серии, т. е. совокупности статистически различимых единиц. В качестве таких единиц могут выступать семья, бригада, школьный класс, небольшие производственные коллективы в учреждениях, почтовые отделения, врачебные участки, населенные пункты, территориальные общности и т. п. Отобранные в выборку серии подвергаются сплошному или выборочному обследованию. Второй вариант используется в практике социологических Исследований гораздо чаще, чем первый. Собственно говоря, любая многоступенчатая выборка представляет собой гнездовую выборку, в которой единицы отбора на высших ступенях являются гнездами из единиц отбора нижних ступеней.

Организация серийной выборки. Серийная выборка имеет существенные организационные преимущества перед простой случайной выборкой, так как значительно легче произвести отбор и изучение нескольких коллективов, бригад, цехов и т. д., находящихся на одном месте, чем нескольких сотен пространственно разбросанных людей. Процедура отбора позволяет сконцентрировать выборку в сравнительно небольшом числе пунктов.

Серийная выборка может организовываться по схемам простой случайной и систематической выборок. Наконец, она может формироваться после предварительного районирования генеральной совокупности.

В первых двух случаях к информации о генеральной совокупности— основе выборки—предъявляются те же требования, что и ко всем вероятностным выборкам: размещение элементов генеральной совокупности (серий) не должно быть каким-либо образом систематизировано.

Метод маршрутного опроса. Этот метод социологи часто используют, когда единицей наблюдения выступает семья.

В выборочную совокупность, например намечено включить определенное число случайно отобранных семей или квартир. На карте города или населенного пункта нумеруются все улицы. С помощью таблицы случайных чисел отбираются большие числа, которые позволяют идентифицировать семьи или квартиры, попавшие в выборку. Каждое большое число рассматривается как состоящее из трех компонентов: первые две или три цифры в нем указывают номер улицы, следующая цифра — номер дома, последняя цифра — номер квартиры в выбранном доме.

Например, число 42—25—3 указывает квартиру № 3 дома № 25 на 42-й улице.

Организация серийной выборки методом маршрутного опроса наиболее приспособлена к городам, где преобладают отдельные квартиры, или к населенным пунктам, где еще сохраняется частное домовладение (в последнем случае отпадает необходимость выбирать номер квартиры).

Возможности и ограничения серийной выборки. При серийной выборке всегда имеет место занижение по сравнению с генеральной совокупностью дисперсии изучаемого признака в силу определенного сходства единиц в сериях.

Например, вполне объяснима заметная связь между членами семьи. Характер профессий детей в определенной мере может завидеть от профессии родителей. Очевидна связь членов семьи в отношении их социальной принадлежности.

С точки зрения статистика, сходство элементов серий приводит к избыточности однотипной, повторяющейся информации. Социолог должен учитывать этот органически присущий серийной выборке статистический порок при прочих равных условиях, выбирая в качестве гнезд такие общности, которые содержат максимально разнородные конечные единицы наблюдения. Так, при изучении, скажем, качества медицинского обслуживания населения города разумно в виде гнезд выбрать совокупность жителей, обслуживаемых отдельными почтовыми отделениями, или проживающих на территории отдельных жэков, но никак не врачебные участки, поскольку последний выбор привел бы к искажению результатов.

Расчет характеристик серийной выборки. Расчет характеристик серийной выборки имеет некоторое отличие от простой случайной и систематической выборок. Это отличие связано прежде всего с вычислением дисперсий и ошибки выборки.

Вычисление средней ошибки серийной выборки основано на дисперсии серийных средних.

Пример. И генеральной совокупности, включающей 16 семей, сделана серийная выборка, состоящая из четырех семей (в каждой семье по 4 человека). Перед исследователями стоит задача найти оценку средней заработной платы в генеральной совокупности, оценку ее дисперсии и среднюю ошибку выборки (табл. 18).

Средняя ошибка бесповторной серийной выборки определяется

Расчет дисперсии серийных средних

Тогда

В зависимости от выбранной доверительной вероятности средняя заработная плата для генеральной совокупности 83,5 ± 21,53.-Например, исследователь может с вероятностью в 0,95 утверждать, что в данной генеральной, совокупности средняя заработная плата не меньше 80,6 руб. и не больше 86,5 руб.

Так как вычисление ошибки для серийной выборки основано на дисперсии серийных средних, то серийный отбор будет тем репрезентативнее, чем меньше степень колеблемости серийных средних, измеряемая величиной их дисперсии.

4. Стратифицированный отбор

Понятие стратифицированной выборки.

Вероятностная выборка с любой техникой отбора (простая случайная, систематическая, серийная или многоступенчатая) становится стратифицированной, если процедурам отбора предшествует выделение в генеральной совокупности однородных частей, называемых стратами,

В статистическом смысле стратификация соответствует выделению таких статистически однородных групп, колеблемость изучаемых признаков которых внутри меньше, чем между ними.

Эта дифференциация внутри генеральной совокупности на качественно более однородные группы содержательно связана предметом исследования.

Стратификация совокупности оказывается необходимой во всех случаях когда совокупность является неоднородной по социальным, экономическим и другим характеристикам единиц наблюдения.

Так исследуя профессиональную ориентацию школьников в пределах одного города, можно в одну страту отнести 16 школ расположенных в районе старых застроек, во-вторую-20 школ, расположенных а районах новостроек. Для опроса можно выбрать выпускников из двух школ первой страты, а также из •двух школ второй страты. Если такая группировка школ действительно отражает различия районов которые существенно учитывать исследовании профессиональной структуры, то, колеблемость изучаемых признаков внутри каждой группы школ должна быть меньше, чем между группами.

В качестве страт могут быть использованы как естественные обрывания, так и специально формируемые для определенного исследования. Например, такими стратами могут выступать мико-географические регионы или области страны, города, классифицированные их административному статусу и по численности населения. Стратами могут выступать, и идеальные образования. Примером является выделение в генеральной совокупности при исследовании отношений молодежи к труду шести групп по содержанию5.

Стратифицирующий признак. Признак, по значениям которого производится стратификация генеральной совокупности, называется признаком стратификации. Стратификация может проводиться по одному или нескольким признакам.

Организация стратифицированной выборки.

Организация стратифицированной выборки требует представления о характере распределения по всей совокупности тех признаков, которые должны быть положены в основу образования типических групп страт. Неправильный выбор признака для группировки элементов генеральной совокупности может не увеличить репрезентативность выборочных данных по сравнению со случайной выборкой того же объема.

Организация стратифицированной репрезентативной выборки связана на практике с известными трудностями, особенно если выделенные страты неравночисленны. Математическая статистика рекомендует в этих случаях, чтобы размеры выборки из каждой страты были пропорциональны средним квадратическим отклонениям в соответствующих стратах генеральной совокупности. Но дисперсии, как правило, неизвестны. Поэтому часто при организации отбора из страт генеральной совокупности производится отбор пропорционально их размеру (доле) в общей численности совокупности.

Еще один употребляемый в социологии вариант выбора — это отбор одинакового количества единиц наблюдения из неравных типических групп.

Выборка организуется в зависимости от рассмотренных вариантов отбора с объемом, который рассчитывается по следующим .формулам.

1. Пропорционально среднеквадратическому отклонению в типической группе, найденному по результатам пробного исследования. Размер (n_i) выборки из i-й типической группы равен

где п — объем всей выборки; N_i=объем i-й группы в генеральной совокупности; l— количество групп. Весь объем выборки равен

Расчет характеристик стратифицированной выборки.

Характеристики такой выборки рассчитываются как «взвешенные» величины: показатели по каждой страте комбинируются в общую среднюю; вклад групповых средних пропорционален «весу» каждой страты в выборочной или генеральной совокупности.

В стратифицированной выборке общая дисперсия выборки имеет как бы два источника: дисперсию групповых средних, которые характеризуют каждую страту s_x², и среднюю дисперсию из дисперсий внутри каждой из этих страт s²_i. Первую составляющую принято называть межгрупповой дисперсией, а вторую — внутригрупповой дисперсией.

Это записывается следующим образом: s= s_x²+ s²_i (7)

Расчет средней ошибки при отборе, пропорциональном численности единиц в стратах, производится по формуле

или, если пренебречь отношением n/N,

В выражениях (8) и (9) s²_i вычисляется исходя из формулы (7), т. е. s²_i=s²-s²_x, где s² — общая дисперсия выборки — подсчитывается как для простой выборки, не принимая во внимание стратификацию.

Из соотношения для средней ошибки (7) следует, что ошибка стратифицированной выборки меньше средней ошибки чисто случайной выборки либо равна ей, когда межгрупповая дисперсия равна нулю.

Пример. Предположим, что выборка содержит 5 страт (группы семей по среднему доходу6). Необходимо определить величину расходов на годовую, подписку. Из каждой 2-й страты взяты по две семьи (объем выборки n = 10, см. табл. 19).

Таким образом, как видно из рассмотренного примера, стратифицированная выборка при прочих равных условиях дает более точные результаты.

5. Многоступенчатые и комбинированные способы, формирования выборочной совокупности

Выборка может строиться как одно или многоступенчатая. При многоступенчатом отборе на каждой ступени меняется единица отбора. Например, на первой ступени производится отбор промышленных предприятий, на второй — отбор бригад на предприятиях, попавших в выборку на первой ступени, на третьей — отбор рабочих из бригад, попавших в выборку на второй ступени отбора, и т. д.

Необходимость многоступенчатого отбора вызвана, как правило, отсутствием информации о всех единицах генеральной совокупности. При многоступенчатом отборе для организации первой ступени необходимо иметь информацию о распределении' того или иного признака по всей совокупности единиц отбора первой ступени. Для организации второй ступени нужна уже только информация об отобранных единицах первой ступени.

На первой ступени, как правило, используется случайный отбор, а, начиная со второй ступени случайно отбирается количество единиц, пропорциональное размеру соответствующей единицы предыдущей ступени и т. д.

Доли отбора на каждой ступени комбинируются таким образом, чтобы в целом доля отбора выборки обеспечивала всем единицам генеральной совокупности равные шансы попасть в выборку.

Пропорциональный способ организации многоступенчатой выборки имеет определенные неудобства. Социолог, с одной стороны, уменьшает объем выборки в целях экономии средств и сокращения сроков проведения исследования, а с другой,— соблюдая принцип пропорциональности, он может получить очень малочисленные группировки по отдельным факторам, которые окажутся недостаточными для статистического анализа.

Существует несколько способов формирования многоступенчатых выборок.

Для примера рассмотрим способ организации двухступенчатой выборки, отбор единиц которой на первой ступени осуществляется с вероятностью, пропорциональной размеру. Воспользуемся для примера условиями и задачами организации выборки в известном исследовании ленинградских социологов.

Единицы первой ступени отбора — предприятия города.

Составляется полный список единиц наблюдений первой ступени отбора — промышленных предприятий и численности молодых рабочих на каждом из них. Генеральная совокупность включала 50 таких предприятий.

Единицы отбора ранжируются по численности рабочих, выделенных в качестве единиц наблюдения принимается решение о включении в выборку определенного числа заводов, например пяти. По таблице случайных чисел выбирается чисел (М₁, М₂, М₃, М₄ и М₅)между N₁ и N (общей кумулированной численностью рабочих в генеральной совокупности). В выборку включаются те предприятия, чьи номера оказались в той же строке (j), которая соответствует кумуляте, содержащей одно из чисел М_k k=1/5 т. е. i = f, если N₁+N₂+…+N_j_-1< М_k < N₁, + N₂ +…+ N_j по всем k.

Вторая ступень отбора реализуется следующим образом. На каждом предприятии, включенном в выборку; выбирается одно и то же число рабочих (единиц второй ступени отбора). Далее отбор может быть случайным или систематическим.

Ошибка многоступенчатой выборки (на примере двухступенчатой выборки). При многоступенчатом отборе (начиная с двухступенчатого) следует учитывать специфику расчета ошибки выборки. Каждая ступень отбора делает свой «вклад» в отклонение находимых оценок от истинных значений характеристик в генеральной совокупности.

Для достаточно большого объема выборки существуют упрощенные формулы расчета средней ошибки.

где s²₁ —дисперсия единиц первой ступени отбора и n¹ —их численность; n²₂ —дисперсия единиц второй ступени отбора и n² — их численность в составе единиц первой ступени отбора в выборке.

В формуле учтены оба источника ошибок репрезентативности при двухступенчатом отборе. Первый член формулы под корнем указывает на дисперсию, вызванную формированием первой - ступени отбора. Второй член указывает на внутригрупповую дисперсию, связанную с организацией второй ступени выборки.

Упрощенность этой формулы состоит в том, что внутригрупповые дисперсии рассчитываются внутри каждой единицы первой ступени после отбора из нее единиц второй ступени. Здесь указана «невзвешенная» средняя из квадратов ошибок по всей сумме единиц второй ступени (n²). Это второй источник случайных ошибок.

Многофазовый отбор.

Многофазовый отбор является особым видом многоступенчатого отбора. Он заключаемся в том, что из сформированной выборки большего объема производится новая выборка (подвыборка) меньшего объема и т. д.

Особенностью этого способа формирования выборочной совокупности, является то, что независимо от числа фаз в последующих подвыборках используется неизменно одна и та же единица отбора, что и в основной выборке.

К многофазовому отбору, прибегают тогда, когда в рамках ис-⁴ следования, которое проводится на большой выборке, возникает необходимость тщательного изучения более узкого круга вопросов. Для этих целей формируется вторая фаза — та же выборка в миниатюре и т. д.

Как и в многоступенчатых выборках, при многофазовом отборе каждая фаза является источником случайных ошибок.

Пример двухфазовой стратифицированной выборки7. В ходе исследования сельского населения возникла необходимость более углубленно изучить его культурные потребности и материальные затраты на «потребление культуры».

Основная выборка (n) была сделана из стратифицированной генеральной совокупности — изучаемый регион был разделен на 5 страт по типу хозяйств: от мелких (1) до самых крупных (5). Вторая фаза выборки (n²) была организована из этой основной..

При исчислении выборочных показателей по выборке необходимо учитывать оба компонента случайной ошибки (как и в случае двухступенчатого отбора), связанного со структурой выборки первой фазы (n) и второй фазы (n^п).

Комбинированные выборки.

Соединение в многоступенчатой выборке различных приемов отбора (простого случайного, систематического или серийного) делает выборку комбинированной.

Как уже указывалось, большинство используемых в современных социологических исследованиях выборок являются комбинированными.

Одноступенчатая стратифицированная выборка. Комбинированная одноступенчатая выборка использовалась социологами ИСИ АН СССР при формировании выборочной совокупности для изучения индивидуальной производительности труда (индивидуальных норм выработки) рабочих сдельщиков.

Пример. На основе предварительного анализа пилотажного массива из шести возможных для формирования выборки признаков (возраст, образование, стаж по профессии и на данном заводе, заработная плата и квалификация) были выбраны два заработная плата и, стаж по профессии. Эти признаки обнаружили наибольшее влияние на изучаемый показатель — норму выработки8.

Генеральная совокупность была стратифицирована на 6 страт, различающихся уровнем заработной платы.

Отбор в стратах имел случайный характер — по распределению второго по «весу» признака (стаж по профессии).

Были известны следующие данные по генеральной совокупности.

где S²=m(1 — m), m-выборочная доля. Дисперсия качественного признака (выполнение нормы сдельщиками) при отсутствии информации была принята равной s² = 0,5 • 0,5 =0,25. Доверительная вероятность 1 — a = 0,95; предельная ошибка репрезентативности D= 0,05.

В связи с тем что построение репрезентативной районированной выборки означает сохранение в выборке пропорции для групп генеральной совокупности, для определения размера групп выборочной

совокупности принимается следующий план9: n_i/n=N_i/N, где N и n —
размеры соответственно генеральной совокупности и выборки; N_i и-
n_i — размеры соответственно страт в генеральной и выборочной совокупностях. Рассчитывается численность каждой страты (представительство групп заработной платы) в выборке.

Пропорциональное построение выборки соответствовало следующим необходимым размерам групп:

Следующая стадия работы заключалась в расчете доли страт стажа. Для пропорционального построения выборки отбор по стажу следует согласовать с планом:

где N_iq — численность каждой страты по стажу в отдельной страте-
по уровню зарплаты в генеральной совокупности, n_iq— соответственно для выборки.

Когда найдены эти доли для каждой страты по стажу, рассчитывается, сколько единиц наблюдения и с каким стажем должно
попасть из каждой такой страты в выборочную совокупность. На
пример, доля для стажа 1—2 года и заработной платы 60—80 руб.
равна 0,60, а для стажа 3—4 года в той же типической группе до
ля равна 0,40. Исходя из них, находим размер выборки для каждой
страты:

Аналогичный расчет производится по всем остальным стратам» В результате формируется план пропорциональной выборки в абсолютных числах и процентах (табл. 20).

По таблице случайных чисел выбираются случайные числа в соответствии о размером каждой группы, представленной в выборке (табл. 20). Предварительно картотека была стратифицирована по группам заработной платы и карточки пронумерованы. Из каждой группы выбирались карточки, соответствующие случайным числам. Если стаж на выбранной карточке должен был быть представлен в данной группы, карточка отбиралась в выборку. Если стаж не должен был быть представлен в данной группе, карточка возвращалась в генеральную совокупность.

Появление карточек, которые возвращались в массив, потребовало дополнительного выбора случайных чисел для каждой группы, пока не был обеспечен намеченный по плану размер. Как видно из

табл. 20, некоторые смещения оказались в группах с большим стажем. Но выборка репрезентативна по контролируемому признаку —
средней норме выработки: в генеральной совокупности — 109%,
в выборке — 108,9%. Рассчитаем по этой выборке оценку доли перевыполняющих план выработки в генеральной совокупности10 (табл. 21).

Чтобы использовать показатель доли по выборке как оценку соответствующего параметра в генеральной совокупности, необходимо рассчитать среднюю ошибку выборки.

Расчет дисперсии доли в стратифицированной выборке производится по формуле:

Расчет средней выборки производится по формуле:

При доверительной вероятности 0,95 предельная ошибка выборки D= ZM = 1,96 *0,0084 = 0,016, или 1,6%.

Таким образом, с вероятностью 0,95 можно утверждать, что доля перевыполняющих план будет в интервале (81 ± 1,6) %.

6. Неслучайные методы отбора и другие подходы к построению выборки

Выборочный метод в условиях недостатка информации о генеральной совокупности. Недостаток информации о, генеральной совокупности в той или иной форме свойствен любому выборочному исследованию (для восполнения недостатка оно и проводится).

Будем выделять два тина априорной информации о генеральной совокупности: а) есть перечень объектов генеральной совокупности и нет сведений о дисперсии изучаемой характеристики, б) нет перечня объектов генеральной совокупности.

В случае а) недостаток информации, как это уже отмечалось выше, преодолевается путем проведения одного-двух пробных исследований.

Для планирования пробных исследований можно рекомендовать использование таблицы достаточно больших чисел11. Один, из вариантов таких таблиц задает численность выборки, рассчитанную на основе закона больших чисел безотносительно к объему генеральной совокупности. Если известен коэффициент вариаций генеральной совокупности, то объем выборки может быть определен по номограммам достаточно больших чисел.

Если генеральная совокупность позволяет найти размах колебания признака, то естественно воспользоваться приближенным расчетом дисперсии с помощью табл. 17.

Для расчетов по качественной характеристике проведение пробных исследований не является обязательным, так как можно пользоваться максимально возможным значением дисперсии s² = 0,25, получаемой при равной доле наличия и отсутствия исследуемого признака. В таком случае планируемый объем выборки оказывается несколько завышенным для выбранного уровня доверительной вероятности.

Случай б) значительно затрудняет использование описанных методов вероятностного отбора в социологических исследованиях. К настоящему времени наметились в социологии две тенденции в их преодолении.

Первая связана с применением более сложных схем случайного отбора стратифицированного, многоступенчатого, комбинированного (о чем речь шла в параграфах 4 и 5 настоящей главы). Вторая связана с отказом от строгого выполнения условий вероятностного отбора.

В социологии применяется ряд приемов формирования выборочных совокупностей, которые строятся по подобию вероятностных, но для которых нельзя строго обосновать, что выборочные характеристики выступают оценками соответствующих характеристик генеральной совокупности. Такие выборки можно назвать эмпирическими, так как они ре имеют теоретического вероятностного обоснования.

Стихийная выборка. Широко известна так называемая выборка «первого встречного», которая лишь на первый-взгляд кажется вероятностной. Социолог в этом случае может бессознательно руководствоваться при выборе лиц для опроса чувством личной симпатии или антипатии, соображениями удобства и т. п.

Выборку «первого встречного» и другие, ей подобные, принято называть не вероятностными, а стихийными. Эти способы организации выборки характеризуются тем, что для них невозможно уточнить, какую генеральную совокупность они представляют.

Примером стихийных выборок являются опросы с помощью радио или телеанкет, а также анкет, опубликованных в печати. Генеральной совокупностью каждый раз выступает аудитория, читатели того или иного-канала, массовой коммуникации. Однако из-за незнания каких-либо характеристик этой генеральной совокупности, а чаще всего и ее размера невозможно определить качество выборки: достаточно хорошо она репрезентирует генеральную совокупность или дает совершенно искаженную картину.

Примером стихийного метода формирования выборки может, служить процедура, разработанная сотрудниками ИСИ АН СССР для опроса посетителей международной выставки «Связь-81»12. Трудность построения' выборки заключалась в том, что было невозможно организовать точный счет посетителей, входящих на территорию и выходящих с территории выставки. Поэтому была предложена компромиссная процедура: несколько интервьюеров, стоящих на каждом входе и выходе выставки, независимо друг от друга начинали вести (со сдвигом во времени) счет посетителей — в выборку отбирался десятый посетитель. Он опрашивался данным интервьюером, и затем этот же интервьюер вновь отбирал десятого посетителя по аналогичной процедуре. Поскольку опрос велся на входе и выходе с выставки, появилась возможность проверить репрезентативность результатов. Сопоставление социально-демографических показателей позволяет говорить о достаточной точности данной процедуры.

Квотная выборка. Наиболее распространенной из числа не строго случайных методик формирования выборочной совокупности является квотная выборка. Она строился как модель, воспроизводящая, структуру генеральной совокупности в виде квот (пропорций) распределений изучаемых признаков или признаков, с ними взаимосвязанных. Число единиц (элементов выборочной совокупности) по различным сочетанием изучаемых признаков определяется с таким расчетом, чтобы оно соответствовало их доле (пропорции) в генеральной совокупности. Квотная выборка часто применяется в массовых опросах населения и особенно при изучении общественного мнения. На основании квотной выборки устанавливается, сколько лиц и с какими характеристиками следует опросить.

Применение квотной выборки в «Чистом виде» возможно при наличии на момент проведения опроса достаточно подробных сведений о генеральной совокупности. Формирование модели генеральной совокупности означает наличие информации о независимом распределении каждого из изучаемых признаков или об их условном распределении. Эта картина с учетом размера выборки должна быть воспроизведена в модели. Самым сложным моментом является (особенно если необходима всесоюзная модель) географическое соотнесение выборки, т. е. определение, какие конкретно населенные пункты включать в выборку.

Непосредственная реализация квотной выборки соответствует организации опроса лиц согласно квотам. Существует два способа задания квот: 1) интервьюеру дается обязательный набор признаков, которым должен обладать каждый респондент, и. указывается общее число респондентов, подлежащих опросу; 2) задание ограничивается перечислением независимых характеристик контингента, подлежащего опросу в определенном населенном пункте.

Первый способ был использован советскими социологами в исследовании городских кинозрителей13. Например, задание для интер-

вьюера, направленного в Магнитогорск, предполагало учитывать при опросе следующие признаки респондентов (табл. 22).

При втором способе это задание выглядело бы так: опросить 6 человек со следующими свободными параметрами:

Формирование модели для квотной выборки полностью соответствует условиям вероятностного отбора.

Отличие квотной выборки начинается со способа отбора респондентов, который содержит опасность систематических смещений. При выборе лиц для опроса интервьюеры на практике часто совершают ошибки типа «выбор себе подобных», В роли интервьюеров нередко выступают студенты, молодежь, неосознанно отдающие предпочтение тем, с кем им легче общаться. Поэтому в квотных выборках часто наблюдается завышение доли лиц с высшим образованием и более молодых возрастных групп.

По некоторым литературным данным, при условии соблюдения оптимального объема квотной выборки ее точность конкурирует с точностью случайных выборок и даже может превышать последнюю14. Однако отсутствие теоретических гарантий точности выводов, полученных с помощью квотной выборки, снижает ее ценность. В связи с этим основное достоинство выборки состоит в простоте ее реализации, быстроте проведения.

Другие сложности и, проблемы построения выборки.

Если исследуется генеральная совокупность по качественному признаку, имеющему всего лишь две градации (да — нет; имею — не имею и т. п.), то возможно применение вышеизложенного аппарата статистических оценок. Но если качественный признак имеет несколько градаций или вообще не разработана его классификация?

В первом случае необходимо предварительно укрупнить имеющиеся градации, сведя их к двум более широким классам. Например, если исследуется признак с тремя градациями: не выполнившие план, выполнившие план и перевыполнившие план, то информация собирается по признаку, измеренному по дихотомической шкале, скажем, в виде: не выполнившие план — одна градация и выполнившие и перевыполнившие план — другая.

Значительно сложнее обстоит дело, если качественный признак оказывается даже не измеренным по номинальной шкале. Например, как применить выборочный метод для исследования образа жизни, общепринятой типологии которого пока еще нет?

Выборку для исследования подобного вопроса нельзя организовать, не имея некоторых показателей, так или иначе связанных с исследуемой качественной характеристикой.

Иногда удается решить вопрос об использовании определенного показателя для организации выборки по качественному признаку путем разработки соответствующих исследовательских гипотез. Например, при исследовании кино аудитории социолог может выдвинуть гипотезу о зависимости вкусов и предпочтений кинозрителя от его образования. Тогда, зная, что в исследуемой генеральной совокупности 15% лиц с высшим образованием, 40% со средним и 45% с неполным средним он должен выдержать эти пропорции в выборке. Если исследовательская гипотеза предполагает также, что вкусы кинозрителя зависят в среднем от его возраста, то в выборке должны быть пропорционально представлены те возрастные группы генеральной совокупности, которые интересуют исследователя. Однако сравнительно редко удается ограничиться двумя-тремя показателями для адекватного представления качественной характеристики. Значительно чаще, прежде чем приступить к использованию выборочного метода (так же как и любого другого статистического наблюдения), необходимо разработать систему показателей, отражающих качественную характеристику.

Построение системы показателей— сложнейший с методической точки зрения этап всего социологического исследования. Сложность усугубляется отсутствием каких бы то ни было формальных критериев для отбора показателей в систему, отражающую данную качественную характеристику. Вопрос в каждом случае решается на основании тщательного содержательного рассмотрения проблемы социологического исследования.

Но трудности не заканчиваются с построением системы социальных показателей для исследуемой качественной характеристики. Возникает вопрос о построении выборочной совокупности по разработанной системе показателей.

Если количество показателей системы невелико, то в принципе возможно последовательное применение изложенного аппарата выборочного метода для одной переменной. Однако этот путь требует значительных усилий, так как приходится по-новому организовывать выборочную совокупность при переходе от одного показателя к другому.

Перспективным оказывается принципиально другой подход при планировании выборочной совокупности, основанный на применении всей разработанной системы показателей одновременно. Особенно эффективным он оказывается, когда число показателей системы велико. А именно этот случай весьма характерен для многих социологических исследований.

Описываемый подход реализуется в социологических исследованиях с помощью того или иного метода многомерного анализа эмпирических данных. Его сущность состоит в предварительной стратификации всей генеральной совокупности по всей системе показателей. Здесь приобретают важное значение различные методы автоматической классификации, например таксономия, метод структурной классификации, а также причинный анализ и методы многомерной статистики15.

Организацию выборочного исследования с применением методов многомерного анализа социологу целесообразно проводить в тесном контакте, со специалистом по многомерной статистике. Все усилия, затраченные социологом при подготовительной работе при организации выборочной совокупности по системе показателей с помощью многомерных методов, окупятся на стадии сбора социологической информации по рассчитанной таким образом выборке и анализу их результатов.

Литература для дополнительного чтения

Введение в теорию порядковых статистик/Под ред. А. Я. Боярского. М. Статистика, 1970. 414 с.

Венецкий И. Г.. Теоретические и практические основы выборочного метода Учеб. пособие. М.: МЭСИ, 1975. 67 с. -

Вороное Ю. П. Распознавание образов и выборка в социологических исследованиях.— В кн.: Социология и математика. Новосибирск: Наука. Сиб. отд-ние, 1970, с. 69—76.

Горяченко Ё. Е. Планирование выборки для комплексного социально-экономического изучения деревни— Социол. исслед., 1975, № 3, с. 45—52.

Дружинин Н. К. Выборочное наблюдение и эксперимент: Общие логические принципы организации. М.: Статистика, 1977. 176 с.

Йейтс Ф. Выборочный метод в переписях и обследованиях. M. Статистика, 1965. 434 с.

Кокрен У. Методы выборочного исследования. М.: Статистика, 1976. 440 с.

Королев Ю. Г. Выборочный метод в социологии: Учеб. пособие. М.: МЭСИ, 1975. 66 с.

Ноэль Э. Массовые, опросы. М.: Прогресс, 1978. Гл. 3. 381 с.

Проектирование и организация выборочного социологического исследования, М.: ИСИ АН СССР, 1977. 167 с. Ротапринт.

Процесс социального исследования. М.: Прогресс, 1975. Разд. I, § 3.2.

Райх А., Волков А. О методе распространения выборочных данных Всесоюзной переписи населения.— Вести, статистики, 1980,.№ 3, с. 19—31,

Территориальная выборка в социологических исследованиях. М.: Наука; 1978. 218с.

Чернышева Т. М. О повышении точности оценки результатов выборочных обследований.— В кн.: Опыт применения прикладных методов математики и вычислительной техники в народном хозяйстве. М.: Статистика. 1978. е. Ш-188.

Шереги Ф. 9. Методические проблемы выборки и репрезентативности в социологической практике.— Социол. исслед., 1977, № 1, с, 112—122.

« Пред. - След.

» Нет комментариев

Пока комментариев нет

» Написать комментарий

« Пред.		След. »

Вернуться