Многоступенчатая комбинированная выборка

Обычно эти подходы (районированный и гнездовой) в научно-методической литературе противопоставляются друг другу. Но в современной практике проведения массовых крупномасштабных исследований при построении выборки чаще всего используются оба этих принципа.

Применяя последовательно на разных ступенях отбора каждый из этих принципов, исследователь добивается повышения репрезентативности выборочной совокупности по различным характеристикам, которые, по мнению исследователя, могут оказывать принципиальное влияние на изучаемое явление.

Приведем несколько примеров подготовки выборки с комментариями, поясняющими соображения, которыми руководствуется исследователь, последовательно реализуя описанные выше принципы на каждой из ступеней отбора.

Например, социолог предполагает исследовать профессиональные ориентации старшеклассников, в частности, ориентации на поступление в вуз. Казалось бы, в данном случае на первой ступени целесообразно применить гнездовую выборку и в качестве «гнезд» рассматривать школы, часть которых следует в случайном порядке отобрать как основу будущей выборочной совокупности.

Однако исследователь принимает во внимание следующие обстоятельства:

  • существуют специальные школы (математические, с углубленным изучением иностранных языков и т.п.), контингент которых в большей степени ориентирован на вуз;
  • таких школ немного в общем перечне школ, и поэтому существует достаточно высокая вероятность, что они не попадут в выборку «гнезд».

Учитывая, что школы, контингент которых в большей степени ориентирован на вуз, может оказаться за пределами выборки, что, несомненно, скажется на данных, касающихся профессиональных ориентации старшеклассников, автор проекта принимает решение — в качестве первого шага произвести районирование (стратификацию) по этому показателю.

Специальные школы выписываются в отдельный список (перечень). В дальнейшем «гнезда» (школы) выбираются из каждого списка отдельно, пропорционально численности старшеклассников в каждой из двух полученных подсовокупностей (общие школы, специальные школы).

Естественно, что в основу районирования (стратификации) генеральной совокупности старшеклассников исследователь может заложить и другие критерии, например, тип городского района (индустриальный, культурно-административный, «спальный» и т.гт.), если он считает, что школы разных районов не являются достаточно идентичными «гнездами» и различия между ними могут принципиально сказываться на результатах опроса.

В итоге, на первой ступени отбора генеральная совокупность стратифицируется (реализуется принцип районирования), а на второй, когда исследователь считает, что в рамках каждой страты «гнезда» достаточно идентичны с точки зрения целей исследования, производится случайный отбор намеченного числа «гнезд» (школ).

В дальнейшем исследователь может в каждой школе проводить сплошной опрос старшеклассников, а может, пользуясь принципом гнездового метода, отобрать классы.
Сколько следует отбирать школ, сколько классов, сколько учеников опрашивать в каждом классе?

Решение этих вопросов в каждом исследовании — это поиск компромисса между требованиями теории (учет всех признаков, дифференцирующих единицы наблюдения и отбора, а так¬же дисперсии этих признаков) и практическими возможно¬стями организации исследования. Понятно, что чем мень¬ше школ, тем легче организовать опрос. Но в таком случае существенное влияние на выборочную совокупность могут оказать особенности школ, не учтенные исследователем.

2. Сочетание районированного (стратификационного) и кластерного («гнездового») подходов обычно используется и при построении территориальных выборок, по которым проводятся массовые опросы общественного мнения. Например, исследователь предполагает провести опрос населения по репрезентативной общенациональной выборке Украины.

Если бы он хотел составить случайную одноступенчатую выборку взрослого населения Украины (старше 18 лет), ему требовалось бы составить список всех избирателей (более 37 млн. человек) и с заданной ошибкой репрезентативности отобрать из общего списка, пользуясь таблицей случайных чисел, требуемое количество единиц наблюдения (например, при средней ошибке — 3% требуется опросить 1800 человек).

На такую процедуру не идет ни один исследователь. Во-первых, сбор и составление об-щего перечня единиц наблюдения — процедура очень трудоемкая, наталкивающаяся практически на непреодолимые препятствия. Но даже если ее осуществить, то в результате будет получено очень рассеянное в пространстве поле выборочной совокупности.

Практически невозможно будет найти интервьюеров, которые согласятся проводить опрос 10-15 человек, локализованных на значительном расстоянии друг от друга. А если бы такие интервьюеры и нашлись, то существенно возрастают транспортные расходы.

Учитывая, что на результате обязательно скажется «недостижимость» части отобранных единиц наблюдения, что в конечном итоге все равно нарушит принцип «равной вероятности попадания каждой единицы генеральной со-вокупности в выборку», приступать к такой работе (подготовке одноступенчатой случайной выборки взрослого населения Украины) нецелесообразно.

Поэтому исследователь сразу решает строить много-ступенчатую выборку. Теоретически здесь лучше применять гнездовой подход, и в качестве «гнезда» использовать избирательные участки (ЖЭКи, почтовые отделения). Это несколько бы упростило процедуру по сравнению с одноступенчатой случайной выборкой, но в принципе те же организационные проблемы также стояли бы перед исследователем.

Кроме того, он лишается возможности сопоставлять результаты исследования по различным регионам, так как их репрезентация не предусмотрена проектом выборки. Для оптимизации процесса организации исследования при построении территориальной выборки обычно на пер¬вом этапе производят районирование: определяют типы регионов таким образом, чтобы можно было сказать, что население одного типа региона достаточно однородно по какому-либо признаку (признакам), а между населением разных типов существуют различия по этому признаку. Затем каждую административно-политическую единицу (область или район) относят к одному из выделенных типов.

В основу типологии берется признак или комплекс признаков, которые, по мнению исследователя, могут существенно влиять на особенности изучаемого явления. Такими критериями типологии могут выступать социально-культурные особенности населения, сложившиеся исторически, особенности этнического состава населения административных подразделений, политические ориентации (выявленные в ходе выборов или референдумов).

Таким образом, критерий типологии определяется в основном предметом исследования и компетентностью автора проекта выборки. Критерий типологии должен быть обоснован в проекте выборки. В дальнейшей работе из каждой страты (типа региона) исследователь будет отбирать число единиц наблюдения, пропорциональное численности населения регионов.

Второй шаг обычно также предусматривает дальнейшее районирование, так как исследователь знает, что обычно тин поселения может существенно сказываться на результатах исследования. Эта типология может быть произведена с различной степенью точности: например, можно выделить два типа (городское и сельское население); можно произвести более тонкую дифференциацию, учитывая численность населенных пунктов, их специализацию в народном хозяйстве и т.д. и т.п.

Здесь опять исследователь ищет компромиссное решение: чем больше типов и признаков заложено в основу типологизации, тем меньше будет ошибка репрезентативности, но тем больший объем выборочной совокупности придется формировать, чтобы наполнить полученные типы. В рабочем плане выборки исследователь определяет численность выборочной подсовокупности каждого типа населенного пункта.

В дальнейшей процедуре все населенные пункты, распределенные по типам, в рамках каждого типа рассматриваются как равноценные «гнезда», из которых производится отбор необходимого числа населенных пунктов.

Следующая ступень может также осуществляться «гнездовым» способом, где в качестве «гнезда» выступают избирательные участки (жэки, почтовые отделения). Эти организации удобно рассматривать в качестве «гнезд», поскольку, во-первых, они располагают списками единиц наблюдения, а во-вторых, достаточно однородны по своей внутренней структуре.

Если исследователь считает, что они не однородны по какому-то важному для исследования качеству, то на третьей ступени он может еще раз произвести районирование (стратификацию) в рамках каждого из населенных пунктов. Из окончательно стратифицированной совокупности кластеров («гнезд») производится их отбор в выборочную совокупность. Все страты и кластеры на различных ступенях представляют собой единицы отбора.

На последней ступени осуществляется отбор единиц наблюдения. Эта процедура может осуществляться различными техниками случайного отбора. Выше описаны процедуры случайного отбора на основе списка (перечня) единиц наблюдения.

В тех случаях, когда исследователь не располагает списками с описанием необходимых для исследования ха-рактеристик, на одной из ступеней отбора (обычно на предпоследней) используется маршрутный метод. Процедура использования маршрутного метода достаточно подробно описана в методической литературе (в частности, в работе Э.Ноэль «Массовые опросы», с.154-157). Поэтому мы не будем останавливаться на технике подготовки маршрутного метода.

Основной его особенностью является то, что этот метод основан на случайном подходе при отсутствии списка и сведений об основных параметрах генеральной совокупности. Основу выборки составляют адреса, а шаг отбора определяется особенностями домостроений (учитывается число квартир в доме, на лестничной пло-щадке, этажность и т.п.).

Следует только обратись внимание исследователя, что лучше, когда отбор адресов для опроса осуществляет не сам интервьюер, а сотрудник, принимающий участие в организации опроса. Нередко исследователи ограничиваются подготовкой инструкции по осуществлению отбора квартир и не учитывают, что интервьюеру трудно держать в голове все повороты «налево во второй дом по правой стороне», считать в домах входные двери и учитывать, на каком этаже он опрашивал респондента в последний раз, когда его основной целью является контакт с респондентом и качественное проведение опроса.

Следует заметить, что некоторые (достаточно солидные) фирмы состав-ление списка адресов возлагают на интервьюера, предоставляя ему карту района. Однако необходимо учи-тывать, что это существенно повышает оплату не только работы интервьюеров, но и супервайзеров, которые долж¬ны контролировать не только качество интервью, но и правильность выполнения инструкций по составлению списка адресов.

Чтобы избежать существенного повышения стоимости исследования, с одной стороны, и снижения качества работы, — с другой, лучше всю процедуру, предусмотренную инструкцией, осуществлять заранее, а интервьюеру предоставлять готовый список адресов и ин-струкцию по отбору респондента в семье.

На последней ступени — отбор единиц наблюдения — также можно использовать принцип случайного отбора респондента из членов семьи, проживающих по установленному адресу. Разработаны различные техники случайного отбора респондента из состава проживающих в квартире членов семьи. Основой большинства из них является список всех членов семьи, который должен составить интервьюер.

Обычно интервьюер составляет список членов семьи в следующей последовательности: сначала всех лип мужского пола в порядке увеличения возраста, начиная с самого младшего члена семьи, достигшего 18 лет, а затем всех лиц женского пола в таком же порядке. Из составленного списка случайно отбирается ! человек.

Для случайного отбора используются либо «кости» (кубик с числовыми значениями от 1 до 6), либо специальные таблицы, которые интервьюер получает от организатора исследования.

3. Примером многоступенчатой случайной выборки является выборка взрослого населения Соединенных Шта-тов, по которой проводит ежемесячные опросы-интервью (face-to-face) Институт Гэллапа. На первой ступени проводится стратификация населенных пунктов: город-село; в свою очередь, городское население стратифицируется по типу города (города, в зависимости от численности населения разделяются на cities и towns), а сельское население районируется по сегментам застройки. Из страт отбирают¬ся 350 «точек опроса» на основе принципа случайного от¬бора.

Каждый интервьюер получает карту-схему «точки опроса» с отмеченной точкой начала «маршрута» и инструкции по установлению домовладений (домов, квартир) в соответствии с принципами маршрутного метода, а также инструкции по отбору респондента в семье (в соответствии с требованиями случайного отбора). Для работы в каждой точке приглашается интервьюер, не проживающий в данной местности. Всего опрашивается около 1000 человек.

Основу выборки составляю: домовладельцы, т.е. из генеральной совокупности взрослого населения заведомо исключаются лица, находящиеся в тюрьме, больнице, проживающие в гостиницах или снимающие квартиру, проживающие на военных базах, а также в общежитиях учебных и религиозных заведений.

После завершения опроса, данные по основным демографическим характеристикам опрошенных сопоставляются с данными последней переписи; производится перевзвешивание результатов опроса с учетом данных переписи, что позволяет повысить «репрезентативность» лиц, которых трудно застать дома. Эти процедуры направлены на приведение выборки в соответствие с основными параметрами взрослого населения (старше 18 лет), проживаю-щего в собственных жилищах.

Поскольку построение данной выборки Института Гэллапа определяется принципами случайного отбора на каждой из ступеней, это дает возможность исследователям подсчитывать ошибку выборки и в ежемесячных публикациях в качестве приложения к результатам опроса предъявлять таблицу, позволяющую читателям «правильно читать» полученные данные, учитывая случайную ошибку выборки (например, «такого мнения придерживаются 23% «плюс-минус» 4%»).

Таким образом, многоступенчатый случайный отбор позволяет определить ошибку репрезентативности на каждой ступени и, соответственно, общую ошибку репрезентативности. Или наоборот, — на основании заранее заданной ошибки вычислить объем выборочной совокупности. Естественно, следует понимать условность правильности расчетов. Эта условность определяется теми критериями, показатели которых учитывались (а особенно — теми, которые не учитывались) при осуществлении типологии объектов репрезентации.

Если исследователь не вдается в точные математические расчеты при подготовке многоступенчатой случайной выборки, он, по крайней мере, может руководствоваться общим (условным) правилом: учитывать, что на каждой ступени число единиц отбора должно быть достаточно большим. В противном случае принцип случайности теряет свой смысл. Например, если из нескольких сот школ города в случайном порядке отбирать 4-6 школ, вполне понятно, что в их число могут попасть нетипичные объекты. Ориентировочное число единиц отбора должно составлять около 300-400 единиц.

Кроме того, не следует забывать, что даже многоступенчатый способ, облегчающий процедуру случайного отбора, не решает проблему «недостижимости» респондентов, попавших в выборку в соответствии с проведенной процедурой случайного отбора. Процедура последующего перевзвешивания результатов обладает как определенными достоинствами, так и недостатками (коррекция информации определяется, во-первых, гипотетическими факторами исследователя, во-вторых, только теми, сведения о которых содержат статистические документы).

Если на определенных ступенях отбора автор проекта предполагает отбирать небольшое число единиц репрезентации, то во многих случаях целесообразнее использовать целенаправленный подход.

В практике эмпирических социологических исследований социологи достаточно часто обращаются к направки пому отбору (либо на некоторых, либо на всех ступенях построения выборки). Нарушая определенные формальные требования, исследователь нередко добивается более достоверной информации, что впоследствии подтверждается результатами референдумов или выборов.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)