Главная
страница 1
Уменьшенная модель

Социологическо-статистическую модель репрезентативной вы­борки, лежащую в основе исследования, с помощью опроса следует представлять себе следующим образом. Весь круг интересующих лиц, который определяется еще до работы над исследованием, состоит из людей различного возраста, профессии и т.д. в отдельных землях Фе­деративной республики и категориях общин различной величины. Идея репрезентативной выборки заключается в том, чтобы создать на примере этой группы людей равноценную уменьшенную модель. В уменьшенной модели всей совокупности представлены также иссле­дуемые мнения и категории ответов в соответствующем соотноше­нии, если эта модель составлена корректно по определенному методу.



Ограничение генеральной совокупности:

кого исследовать?

Сразу после того, как сформулирована задача исследования, сле­дует установить (определить), какой круг лиц должен быть исследо­ван, какую совокупность, “популяцию”, какой “универсум” должны описывать результаты исследования.

Даже для самого обычного опроса населения должны быть, напри­мер, определены возрастные границы: нужно ли исследовать мнения части населения, имеющей право голоса, или всех людей старше 16 лет, или, чтобы лучше учесть молодых покупателей, с 14 лет включи­тельно. Следует ли проводить верхнюю возрастную границу, напри­мер: какие газеты читают люди в возрасте от 16 до 70 лет?

Таким образом, имеются многочисленные и разнообразные огра­ничения генеральной совокупности. Это могут быть, вероятно, одни лишь мужчины или одни лишь женщины, население определенного города или определенной области или жители одной какой-то катего­рии населенных пунктов, например жители деревенских общин, под­писчики ежедневной газеты, владельцы автомобилей, люди одной профессии, работники одного предприятия, а также, может быть, их жены. Здесь нужно принять решение - кто интересует исследователей.

Может быть, придется получать информацию не об индивидах, а о семьях. Это перечисление можно продолжать очень долго. Но все же нельзя совершенно произвольно определять генеральную совокуп­ность. Уже при определении круга лиц, к которым будут относиться ре­зультаты исследования, нужно думать о практических возможностях составления репрезентативной выборки.

Мнение всех здравомыслящих

Условием формирования выборки является, как правило, однозна­чное объективное определение изучаемой совокупности. Все при­меры, перечисленные выше, содержат такие объективные характеристики, хотя, если подходить серьезно, они еще нуждаются в уточне­нии. “Подписчики ежедневной газеты”: идет ли речь о главе семьи или о всех взрослых в семье подписчика? “Владельцы легкового автомо­биля”: должны ли это быть “владельцы” в юридическом смысле слова или “имеющие в распоряжении” - например, лица, которым предо­ставлена служебная машина?

Определить мнение всех здравомыслящих” - такое задание вовсе не содержит объективного основания для вычленения группы лиц, к которым будут относиться выводы исследования. Также невозможно устроить опрос “хороших врачей”, но можно было бы исследовать мнения “всех врачей”, или “всех практикующих врачей”, или “всех практикующих врачей и специалистов”, или “всех врачей больниц”. Даже размер практики врача мог бы стать основанием для определе­ния выборочной совокупности.

Почему иногда приходится опрашивать не тех людей?

Предположим, что нужно исследовать, какие рисунки предпочи­тают покупатели на шерстяных одеялах, чтобы на основании этого планировать выпуск новой продукции. Кажется ясно, что лучше всего опросить людей, которые в недалеком будущем собираются купить новое шерстяное одеяло.

Если опрос планируют шире и спрашивают также тех, кому за по­следние десять лет приходилось покупать шерстяные одеяла, то в этом случае можно сделать странное наблюдение.

Люди, которые в ближайшее время собираются купить шерстяное одеяло, при богатом выборе предлагаемых образцов очень редко вы­бирают клетчатые одеяла. Люди, которые за последние годы сами по­купали одеяла, делают совершенно иной выбор. Среди них очень мно­гие выбирают клетчатые одеяла. Если их спрашивают, какие одеяла они купили себе сами, выясняется интересный факт: из года в год про­дается все больше клетчатых одеял; те, кто делал покупки недавно - не более двух лет назад, - в большинстве случаев высказывались за клетча­тые одеяла. Таким образом, фабрикант не может ориентироваться на людей, планирующих покупку, которые в интервью так редко предпо­читали клетчатые одеяла.

Лучший прогноз сбыта можно составить на основании мнения тех людей, которые лишь недавно купили шерстя­ное одеяло.

Это не единичный случай. Аналогичные явления можно часто на­блюдать в связи с предметами, которые приобретаются не часто. Пред­почтения остаются прежними до тех пор, пока не начинают готовиться к новой покупке, не рассматривают с возобновившимся интересом куп­ленные знакомыми одеяла и не разглядывают в магазине выставлен­ные во всем блеске новейшие образцы. Те, кто купил одеяла недавно, имеют уже ориентацию, которую сформируют у себя также будущие покупатели.

Можно сформулировать правило: в исследованиях о будущем пове­дении, о будущих решениях нужно опрашивать так называемых “не тех” людей, то есть не тех, кто в ближайшее время будет решать, а тех, кто в недалеком прошлом уже решил. От них можно узнать лучше и до­стовернее о том, что будут делать будущие покупатели.

Правило легко сформулировать, но его соблюдение требует не­редко сложных размышлений о нашем привычном мире, о нашей ори­ентации на других людей, а также из области статистики. Если, напри­мер, для подготовки закона о жилищном строительстве хотят узнать о финансовых планах людей, намеревающихся строить собственные дома, об их мнениях по поводу выбора места строительства, то нужна большая решительность, чтобы обратиться со всеми вопросами именно к тем, кто только что закончил строительство своего дома. Вдруг будущие владельцы собственных домов будут вести себя совсем иначе, будут иметь другие планы и желания? Все это нужно взвесить. Вероятность мала, но при этом велика опасность получить нереали­стичные сведения от людей, которые по многочисленным вопросам еще не имеют того опыта, который в конечном итоге будет определять их решение.

“Не тех” лиц стоит опрашивать также в целях сравнения. Возьмем пример из исследования мотивации. Чтобы узнать, по каким причинам определенные люди не решаются купить мотоцикл или мотороллер фирмы “Y”, нужно для сравнения провести репрезентативное выбо­рочное исследование среди лиц, купивших марку “Y”.

Только из сравнения с реакцией сторонников марки “Y” можно уз­нать, почему покупатели, не покупающие марку “Y”, приняли такое ре­шение. Это сравнение выглядит приблизительно так:

ВОПРОС: “Каковы Ваши планы: собираетесь ли Вы когда-нибудь купить машину или о машине не может быть и речи?”

Покупатели мотоциклов, которые собирались купить марку “Y” и затем:

купили марку “Y” не купили марку “Y”

Планируют купить автомобиль 32°/о 49%

Не думают покупать автомобиль 68% 51%

100% 100%

Решение не покупать марку “Y”, таким образом, очевидно, связано с желанием купить автомобиль. Как это объяснить?

Перед покупателями, которые не выбрали марку “Y”, при покупке неосознанно стоял мысленный образ автомобиля, который, хотя и не­доступен, все же предпочтительнее, чем мотоцикл. А мотоциклам марки “Y” как раз не хватает тех качеств, которые делали бы мотоцикл похожим на автомобиль (удобство, много хрома, как можно больше за­крытой поверхности и т.д.). Поэтому эти покупатели брали другую марку, которая была ближе к их мечте.

Кого опрашивать? Выбор респондентов


“Собственно статистическая проблема, - пишет Келлерер о выбо­рочных исследованиях, - возникает в связи со следующими тремя во­просами”:

а) каков должен быть объем выборки;

б) как должен происходить отбор элементов выборки;

в) в какой мере можно положиться на результаты выборки, то есть в какой степени они правильно отражают истинное положение вещей?

Вопросы а) и в) уже рассматривались в предыдущем разделе о “за­коне больших чисел”, и позднее мы еще раз вернемся к ним. Сейчас займемся вопросом б): “Как должен происходить отбор элементов вы­борки?” Об элементах можно говорить вообще, так как принципы от­бора практически одинаковы - идет ли речь о выборке людей или до­машних хозяйств, или предприятий розничной торговли, или бензоко­лонок, или кинотеатров, или школьных зданий, или крестьянских дво­ров, или различных объединений.

Вероятностные методы и метод квот

В принципе различают два метода отбора при построении репре­зентативной выборочной совокупности:

а) вероятностные методы, в значительной степени использующие теоретико-вероятностный подход. Иногда в связи с описанием этих методов используют английские слова и говорят о рэндомизации (рэндом - случайность) или о пробабилистической выборке (probability - ве­роятность);

б) отбор по методу квот, который предписывает интервьюеру выде­лить определенное количество опрашиваемых в разных группах насе­ления.

Выбирает случай? Это легкомыслие!”

Фабрикант, решивший провести анализ спроса на товары, обраща­ется за консультацией о методах исследования в Институт по изуче­нию конъюнктуры. При этом он неизбежно теряет доверие к исследо­вателям, когда в отделе статистики математик настойчиво советует ему: “Выбор опрашиваемых обычно проводится чисто случайно...”

Снова и снова мы убеждаемся, что двойной смысл основных поня­тий статистики затрудняет понимание и даже ведет к недоразумениям.

“Случайность” для математика означает совершенно противопо­ложное тому, что мы обычно понимаем под словом “случай”. Для него это строгий, последовательно осуществляемый метод, помогающий выполнить основное требование: “Каждый элемент генеральной сово­купности в репрезентативном исследовании должен иметь соизмери­мые и отличные от нуля возможности попасть в выборку”.

Случайность, которая удовлетворяет этому условию, знакома нам по лотерее: каждый, кто покупает билет, верит в то, что были приняты все надлежащие меры, чтобы каждый билет имел равные и отличные от нуля возможности выигрыша.

Точно такие же условия должны быть созданы для отбора людей с помощью вероятностного метода в опросах населения. Здесь нецеле­сообразно рассматривать особые случаи в статистике Важно обеспечить, чтобы в принципе каждый представитель группы населения, мнение или поведение которой исследуется, имел равные с другими возмож­ности попасть в выборку. При этом вероятностные методы предназна­чены для того, чтобы исключить “всякий субъективный момент при отборе”.



Основные типы вероятностной выборки

Г. Келлерер показывает на ряде примеров, как осуществляется ве­роятностный метод выборки. При этом он рассматривает четыре ос­новных типа выборки:

- простая,

- стратифицированная,

- территориальная,

- многоступенчатая.

Приводятся следующие примеры простой выборки:

В одном ведомстве по вопросам труда заведены личные карточки, 8000 шт. (N=8000), по одной на каждого зарегистрированного человека. Объем выборки опреде­лен: n =400. Следуя традиционным путем, нужно было бы положить все карточки в большую емкость и хорошо перемешать, а затем вытащить 400 штук. Тысячи лотерей­ных билетов, скатанные в одинаковые ролики, можно привести с помощью барабана в случайный порядок, для карточек из картотеки такой способ вряд ли пригоден. Кроме того, карточки при этом были бы приведены в ненужный беспорядок, возможно, даже повреждены.



Выход в этой ситуации лежит в нумерации карточек от 1 до 8000 для последующего применения таблицы случайных чисел. Это табличные ряды, например, из 10 000 цифр, которые расположены в совершенно случайном порядке. Изготовление таких таблиц - множество их имеется в продаже - наряду с этим возможно также машинным спосо­бом...

Применяя такую таблицу - ее можно назвать “урной про запас”, - следует действо­вать так:

Отмечаем начало в любом месте таблицы и постоянно берем четыре следующих друг за другом числа. Мы получаем, например, 1081,0412,6357,3180,0089... Тогда в кар­тотеке мы отбираем карточки с порядковыми номерами 1081, 412, 6357, 3180, 89... Но­мера свыше 8000 мы пропускаем.

Проще обстоит дело при “систематическом методе отбора”. Объем выборки n =400 - это двадцатая часть от 8000 карточек в только что приведенном примере. Мы начи­наем с какого-нибудь числа в пределах 20, например с 3. Затем после этого номера “З” берется каждая 20-я карточка, так мы получаем номера 3,23,43.., 7983. Особенно удачен этот метод там, где все элементы совокупности уже пронумерованы и стоят в правиль­ном порядке...

Третий метод - это “способ конечных цифр”. Он также предполагает пронумеро­ванную совокупность - от 1 до N. Для того чтобы выбрать из нее 20% всех случаев, сле­дует отобрать все элементы, номера которых оканчиваются, например, на 2 или 9, так как каждая из этих цифр - 2 или 9 - представлена в 10% всей совокупности. Для того чтобы получить 3% всего объема, достаточно выбрать все элементы, порядковый но­мер которых кончается парами цифр 21, или 48, или 73. Преимуществом этого способа является то, что карты не должны лежать в порядке возрастания от 1 до N.

Отбор по буквам или по дням рождения часто также обеспечивает хорошее прибли­жение к настоящей вероятностной выборке. На больших группах населения мы приме­няем способ выбора лиц, фамилии которых начинаются с определенной буквы, или же всех лиц, которые родились в определенный день - например, 8 декабря какого-нибудь календарного года. Конечно, можно взять также несколько начальных букв или дней рождения, чтобы увеличить объем выборки. При этом мы исходим из в целом получаю­щей подтверждение гипотезы, что нет никакой связи между начальными буквами фа­милии или днем рождения, с одной стороны, и интересующими нас статистическими признаками населения - с другой. Так, мы предполагаем, что календарный день рожде­ния не оказывает влияния на доход соответствующего лица, что 20-25-летние мужчины в Федеративной Республике Германии, фамилии которых начинаются с буквы Д, так же распределяются по весовым категориям, как и мужчины того же возраста, фамилии ко­торых начинаются с другой буквы”.

Стратифицированную выборку применяют тогда, когда генераль­ная совокупность, которую хотят выборочно исследовать, не гомо­генна (не однородна). В этом случае составляют различные страты, об­ладающие большей гомогенностью, и затем проводят дальнейший от­бор внутри этих страт, чтобы уменьшить область рассеивания, которая тем меньше, чем больше гомогенность “исходной массы”. Г. Келлерер приводит пример из практики составления переписей сельскохозяйст­венных предприятий, когда, чтобы скорее получить предварительные результаты, осуществляется выборочный анализ.

Территориальную выборку Г. Келлерер описывает на следующем примере:

Если требуется, например, провести репрезентативный опрос хотя бы среди квар­тиросъемщиков крупного города А, то сталкиваются с серьезной трудностью- нет спи­ска всех квартиросъемщиков, который можно использовать для составления выбороч­ной совокупности. Но выход есть: вся городская территория на основании плана городе с очень крупным масштабом делится, например, на М=2000 кварталов; их нумеруют в форме серпантина от 1 до 2000. Когда будет сделана эта предварительная работа, можно подвергнуть обследованию каждый 20-й квартал. Теперь нам нужно в 100 выбранных кварталах собрать точные данные о всех квартиросъемщиках. Эта территориальная вы­борка может быть удачной даже тогда, когда у нас есть действительный список всех квартиросъемщиков по двум причинам:

а) “территориальная выборка” ограничивается определенными кварталами и поэ­тому уменьшаются расходы на дорогу и потери времени;

б) список жителей никогда не бывает совершенно точным, так как постоянно происходит пополнение и выезд. В территориальной выборке заложен учет текучести в принципе”.

В четвертом основном типе - многоступенчатой выборке - сначала также выбираются в известной мере “гнезда” из всей генеральной со­вокупности способом систематической случайности, например отби­раются определенные округа или населенные пункты в стране. Внутри “гнезд” или “ячеек” (англ. spots) отбор происходит по принципам про­стой выборки. В качестве примера двухступенчатой стратифицирован­ной выборки Г. Келлерер приводит исследования “Анализ читатель­ской аудитории”, организованные группой из 40 издателей, рекламных агентов и распространителей. Опрос должен был выяснить числен­ность и состав читательской аудитории популярных немецких журна­лов.

„Целью подобного анализа читателей является выяснение численности, географи­ческого распределения, демографической, экономической и социальной структуры чи­тателей целого ряда известных газет...”

„До сих пор специально для этого основанная “Группа по анализу читателей” в Германии провела четыре крупных исследования читатель­ской аудитории. В качестве генеральной совокупности было избрано население всей Германии, в возрасте от 16 до 70 лет, так как эта группа наиболее интересна с точки зрения распространения печати. Для того чтобы, не­смотря на глубину поставленного вопроса, получить возможно больше ответов, исследование проводилось в форме интервью. В общей сложности в двухступенчатую стра­тифицированную выборку было включено 17 000 человек. Они отбирались по следую­щей схеме:

а) Сначала вся обследуемая территория была разделена на десять групп “А” и семь групп “Б”. Самостоятельные группы “А” образовывали такие большие города, как Гам­бург, Бремен, Берлин. Остальные семь федеральных земель были соответ­ственно разделены на группу “А” (она включала все населенные пункты с числом жите­лей 2000 и больше) и на группу “Б” (населенные пункты с числом жителей меньше 2000). Эта стратификация целесообразна, поскольку условия жизни в населенных пун­ктах с числом жителей меньше 2000 человек отличаются от таковых в крупных населен­ных пунктах. Кроме того, не исключены региональные различия: например, в земле Се­верный Рейн - Вестфалия особенности читателей не такие, как в Баварии.

б) Внутри групп “А” с учетом географического положения были сформированы “ячейки”, куда входило по несколько общин или части нескольких общин. “Ячейки” ох­ватывали ровно 600 000 человек (таким образом, Гамбург и Берлин были рас­пределены между несколькими “ячейками”). В результате получено 62 “ячейки А”. Вну­три групп “Б” также были сформированы “ячейки” При этом исследователи объеди­няли общины по карте в направлении с севера на юг. В каждой “ячейки Б” оказалось примерно 350000 жителей, всего таких ячеек было 38. Эта работа опиралась на данные ведомственной статистики о количестве жителей в общинах.

На первом этапе отбора в каждой из этих 100 ячеек методом простой выборки было вычленено по 8 выборочных районов. При этом строго учитывалось, чтобы каждая община имела возможность по­пасть в выборочную совокупность пропорционально своей величине. Так, например, община с 12 000 жителей обладала в четыре раза большей вероятностью попасть в вы­борку, чем община с 3000 жителей. Поскольку в результате этого на определенную часть крупных общин приходилось два или больше выборочных района, в целом было получено всего 624 выборочные общины. В каждой из этих отобранных общий с по­мощью местной картотеки населения систематическим способом отбора было выде­лено установленное количество адресов (второй этап выборки).

В 62х8 выборочных районах “ячеек-А” было взято по 25 адресов, а в 38х8 выбороч­ных районах “ячеек-Б” - по 14 1/3 адресов. Так учитывалось, что в каждой “ячейке-А” около 600 тыс. жителей, а в “ячейке-Б” только 350 тыс. На Западный Берлин выпало 747 адресов. Итак, в общей сложности получилось 62x8x25+38x8xl41/з+747 = 17 500 адресов.

Они были распределены по сети интервьюеров таким образом, что каждый из по­чти 500 интервьюеров по всей стране и в Берлине получил список домов, ко­торые он должен был посетить. Интервьюеры должны были сперва выяснить объек­тивные данные о лицах в возрасте от 16 до 70 лет в строго указанной последовательно­сти, с учетом пола и возраста. С помощью ряда чисел от 1 до 9 в случайной последова­тельности, который был приложен к каждому адресу, следовало затем определять рес­пондента. Например: следует провести интервью в семье из 4 человек в возрасте от 16 до 70 лет. Если к адресу приложен ряд случайных чисел: 7,5,2, б, 1,3,8,9,4, то следовало опрашивать второго члена семьи потому, что 2 - первая цифра, которая в этом ряду слева направо меньше или равна 4. Единицей обследования здесь является не семья, а отдельный человек. Нужно следить за тем, чтобы при выборе опрашиваемого лица ис­ключить любой субъективный момент.

Если соответствующего человека не было дома, то интервьюер должен снова посе­тить его и даже при необходимости несколько раз. Бывает и так, что, несмотря на трое­кратные попытки визитов, все же не удавалось застать этого человека дома. Другая часть опрашиваемых отказывалась от интервью. Этими или другими причинами можно объяснить, что было проведено лишь 14 200 интервью. На практике, таким обра­зом, в выборке появлялись пробелы. Мы затрагиваем здесь трудный вопрос исследова­ния рынка и общественного мнения, так называемую проблему “белых пятен”, возни­кающую из-за того, что не опрошенные и (или) не давшие ответа лица могут сильно от­личаться в своем отношении к исследуемым проблемам. Только если доля пробелов невелика, с ней можно примириться”.


Списки, картотеки или территориальный отбор


Сущность метода вероятностной выборки заключается в том, что отбор людей или других элементов следует производить по “правилам случая” из генеральной совокупности, на изучение которой направ­лено данное исследование. Для этого необходимо всю совокупность представить каким-либо образом в форме, доступной для процедуры выборки. Это могут быть либо полные и постоянно обновляемые спи­ски или картотеки на всех членов совокупности; когда их нет или их ис­пользование связано со значительными практическими трудностями, можно воспользоваться способом “территориального отбора”. Такой пример опроса жильцов дает Г. Келлерер.

При территориальном отборе людей или домов нужно особо учесть, чтобы в выборку попали также те группы лиц, которые при опросах часто остаются без внимания - например, люди, живущие во флигеле или в мансарде, члены семьи квартиросъемщика. Кроме того, нужно следить, чтобы при отборе не отдавалось предпочтение тем, кого легко застать дома. По этой причине определять выборку и прово­дить интервью следует раздельно. Такое разделение необходимо также и по другим причинам.

Так, например, если нужно опросить фермеров по тематике, связанной с их работой, то возникает опас­ность, что интервьюеры предпочтут умных фермеров, так как такое специфическое ин­тервью легче и быстрее проводить с интеллигентным собеседником; и это, кроме того, кажется интервьюеру полезнее, результативнее для цели исследования. В таком случае проводится раздельная выборка адресов. Интервьюер получает для этого квотную ин­струкцию, которая ему указывает, сколько он должен выбрать фермеров с размером хо­зяйства менее 5 га, сколько - с размером хозяйства более 5 га (в основе лежат официаль­ные статистические данные). Кроме того, в списки заносятся лишь те фермеры, имена которых начинаются с определенной буквы или с букв, следующих за указанными (соче­тание метода квот и вероятностного отбора); таким образом ограничивается влияние интервьюера на отбор опрашиваемых. Интервьюер отсылает адреса респондентов в ин­ститут, там они проверяются и вместе с материалами опроса отправляются снова интер­вьюеру.

Ниже приводятся две инструкции в качестве примера применения вероятностной выборки в картотеках и территориального отбора в рай­оне города.



Инструкция для выявления адресов из учетной картотеки общины (населенные пункты с количе­ством жителей более 50 тыс.) Мюнхен

Мы просим Вас отобрать в этой общине соответственно нашей инструкции 75 адресов.


Смотрите также:
Уменьшенная модель
153.29kb.
1 стр.
Моделирование Введение понятия «модель». Модель
320.79kb.
1 стр.
Модель аппарата Модель картриджа
225.9kb.
1 стр.
Моделирование. Компьютерные модели Модель
342.47kb.
1 стр.
Модель фигура Главное
134.32kb.
1 стр.
Инструкция по эксплуатации технические характеристики Модель
50.24kb.
1 стр.
Модель фасетного информационного поиска в коллекции научных материалов
140.72kb.
1 стр.
Магнитный сверлильный станок мва-38 Новая модель 2012г
135.86kb.
1 стр.
Модель внутривузовской профессиональной социализации студентов
1092.43kb.
4 стр.
4. Принцип устройства обучаемых систем управления Биогидравлическая модель нервной системы
228.9kb.
1 стр.
Исследование snps, микросателлитный анализ и др. Основные характеристики: Усовершенствованная система температурного контроля; Новый долговечный твердотельный монолучевой лазер
53.14kb.
1 стр.
Модель тонкого деформируемого пневматика
434.29kb.
7 стр.