Новости

Выборочное исследование

Работа добавлена:






Выборочное исследование на http://mirrorref.ru

Выборочное исследование

1 Понятия "выборка", "единица выборки", "объем выборки", "структура выборки"

Выборка — совокупность элементов подмножества большей группы объектов.

Единица выборки — элемент генеральной совокупности, выступающий в качестве единицы счета при различных процедурах формирования выборки.

Объём выборки — число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30—35.

Структура выборки — процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность.

    2  Этапы проектирования выборки

Проектирование выборки является процессом, который предназначен для составления такой группы, принадлежащей к генеральной совокупности, которая будет иметь минимальное количество людей (или других объектов), и при этом с максимально возможной правильностью отражать мнения и характеристики генеральной совокупности.

При построении выборки, как правило, используется принцип случайности, означающий в нашем случае равномерность распределения и, как следствие, высокую репрезентативность.

Проектирование выборки включает в себя несколько этапов, а именно:

Определение целевой совокупности. На этом этапе производится выяснение того, какая именно группа должна быть исследована для получения необходимых маркетинговых данных.

Составление списка совокупности. На этом, втором, этапе необходимо получить базу, содержащую данные о представителях целевой совокупности для построения контура выборки. Здесь также необходимо проанализировать контур выборки и сделать выводы о том, попали ли в список люди, не являющиеся представителями генеральной совокупности, и наоборот, не существует ли таких групп людей, которые являются представителями ГС, но в список не попали.

Следующим этапом является проектирование выборочного плана. Здесь исследователи должны разработать такой план построения выборки, при котором её репрезентативность будет наибольшей, а затраты времени и средств на её исследование будут наименьшими. Баланс достигается за счёт определения ограничений и степеней важности, соответствующих целям исследования и возможностям компании.

Далее проводится установление методов доступа к совокупности. На этом этапе происходит выбор способов опроса людей, входящих в генеральную совокупность. Выбор этих методов зависит от возможностей опрашивающих, целей и задач исследования. В некоторых случаях лучше подойдёт телефонный опрос, в других – анкетирование и т.д.

На следующем этапе производится составление необходимой численности выборки. Необходимость этого процесса обуславливается тем, что не всегда возможно получить информацию от того или иного респондента, попавшего в выборку, по разным причинам. Для устранения этой проблемы можно просто выбрать следующего по списку респондента, увеличить объём выборки или провести проектирование новой выборки.

Далее исследователи должны провести проверку выборки на соответствие предъявляемых к ней требований, зависящих от целей и задач исследования. Также необходимо проверить выборку на предмет её репрезентативности.

В случае, если полученная выборка не соответствует требуемым параметрам и критериям, необходимо провести построение новой выборки.

   3  Основные принципы определения объема выборки. Определение объёма выборки

Точность — степень ошибочности результатов обследования или размер доверительного интервала.

Абсолютная точность задается определенным интервалом, в котором должно находиться оцениваемое значение.

Относительная точностьопределяется относительно уровня оценки параметра.

Достоверность — степень уверенности в том, что оценка близка к истинному значению.

При определении объема выборки следует принимать во внимание некоторые качественные факторы: важность принимаемого решения, характер исследования, количество переменных, характер анализа, объемы выборки, которые использовались в подобных исследованиях, коэффициент охвата, коэффициент завершенности, а также ограниченность ресурсов. Статистически определенный объем выборки — это чистый, или конечный, объем выборки, т.е. единицы совокупности, остающиеся после исключения потенциальных респондентов, которые не отвечают заданным критериям или не закончили интервью. В зависимости от коэффициентов охвата и завершенности может потребоваться намного больший объем исходной выборки. В коммерческих маркетинговых исследованиях недостаток времени, денег и хороших специалистов может иметь решающее значение при определении объема выборки. В проекте исследования постоянных покупателей универсального магазина объем выборки определялся именно по этим соображениям.

Метод доверительных интервалов:

Определение объема выборки методом доверительных интервалов основано на их создании вокруг выборочного среднего или выборочной доли с использованием формулы стандартной ошибки. В качестве примера предположим, что исследователь с помощью простого случайного отбора сформировал выборку из 300 семей для того, чтобы оценить ежемесячные расходы семьи на покупки в универмаге, и определил, что средний ежемесячный расход семьи в выборке равен 182 долл. Предыдущие исследования показали, что среднеквадратичное отклонение расходов в исследуемой совокупности равно 55 долл.

Мы хотим найти интервал, в который попадал бы определенный процент выборочных средних. Предположим, мы хотим определить интервал вокруг среднего значения совокупности, который включал бы 95% выборочных средних, опираясь на выборку из 300 семей; 95% выборочных средних можно разделить на две равные части, половина меньше и половина больше среднего, как показано на рис. 1. Вычисление доверительного интервала включает определение области меньше (XL) и больше (ХU) среднего значения (X) величины расходов.

95%-ный доверительный интервал

Значения коэффициентаz, соответствующиеXL и ХU, можно рассчитать следующим образом:

Где

Следовательно, минимальное значениеX определяется как

а максимальное значение

Доверительный интервал устанавливается как

Теперь установим 95%-ный доверительный интервал вокруг выборочного среднего, равного 182 долл.Для начала мы вычислим стандартную ошибку среднего:

Центральные 95% нормального распределения находятся в пределах ?1,96 значений коэффициентаz; 95%-ный доверительный интервал определяется как

Таким образом, 95%-ный доверительный интервал простирается от 175,77 до 188,23 долл. Вероятность нахождения истинного среднего значения наблюдаемой совокупности в пределах от 175,77 до 188,23 долл. составляет 95%.

Метод среднего:

Метод, использованный для создания доверительного интервала, можно модифицировать так, чтобы определить объем выборки с учетом желательного доверительного интервала. Предположим, что вы хотите рассчитать ежемесячный расход семьи на покупки в универмаге более точно — так, чтобы полученный результат находился в пределах 5,0 долл. от истинного среднего значения исследуемой совокупности. Каким должен быть объем выборки? В таблице приведен необходимый перечень действий, которые вы должны выполнить.

1. Определите степень точности. Это максимально допустимое различие (D) между выборочным средним и генеральным средним. В нашем примереD = +5,0 долл.

2. Укажите уровень достоверности. Предположим, желательный уровень достоверности 95%.

3. Определите значение нормированного отклоненияz, связанное с данным уровнем достоверности. При 95%-ном уровне достоверности вероятность того, что среднее значение генеральной совокупности выйдет за пределы одностороннего интервала, равна 0,025 (0,05/2). Соответствующее значениеz составляет 1,96.

4. Определите стандартное отклонение среднего генеральной совокупности. Его можно получить из вторичных источников или рассчитать, проведя пилотное исследование. Кроме того, стандартное отклонение можно установить на основе мнения исследователя. Например, диапазон нормально распределенной переменной примерно укладывается в шесть стандартных отклонений (по три слева и справа от среднего значения). Таким образом, можно рассчитать среднеквадратичное отклонение, разделив величину всего диапазона на 6. Исследователь часто может определить размеры диапазона исходя из собственного понимания анализируемых явлений.

5. Определите объем выборки, воспользовавшись формулой стандартной ошибки среднего

В нашем примере

(округленное в большую сторону до ближайшего целого числа).

Из формулы объема выборки видно, что он растет с ростом изменчивости (дисперсии) генеральной совокупности, а также с увеличением уровня достоверности и степени точности, с которой должны проводиться расчеты. Объем выборки прямо пропорционаленQ2, поэтому, чем больше показатель дисперсии генеральной совокупности, тем больше объем выборки. Аналогично, более высокий уровень достоверности предполагает большее значениеz и, следовательно, больший объем выборки. ПеременныеQ2 иz находятся в числителе. Увеличение степени точности достигается уменьшением значенияD и, следовательно, увеличивает объем выборки, посколькуD находится в знаменателе.

6. Если объем выборки составляет 10% и больше от объема генеральной совокупности, то применяется окончательная коррекция совокупности (fpc).Затем необходимый объем выборки рассчитывается по формуле

гдеn — объем выборки до применения окончательной коррекции;nс — объем выборки после применения окончательной коррекции.

7. Если среднеквадратичное отклонение совокупности о неизвестно и используется его предположительное значение, то его следует повторно рассчитать после получения выборки. Среднеквадратичное отклонение выборкиs используется в качестве предположительного значенияQ. Затем следует вычислить исправленный доверительный интервал, чтобы определить фактически полученную степень точности.

Предположим, что значение 55,00 использовалось в качестве предположительного значения а, потому что истинное значение было неизвестно. Получена выборка, в которойn = 465. На основе данных исследования рассчитывается среднееX, равное 180,00, и среднеквадратичное отклонение выборкиs, равное 50,00.Тогда исправленный доверительный интервал составит:

Или

Обратите внимание, что полученный доверительный интервал уже предполагаемого. Это вызвано тем, что среднеквадратичное отклонение совокупности завышено на основании выборочных характеристик.

8. Иногда точность определена в относительных, а не в абсолютных показателях. Другими словами, может быть известно, что результат вычисления должен составить плюс-минусR% от среднего. Это означает, чтоD =Rm. В этом случае объем выборки можно определить как

где нужно рассчитать коэффициент вариации

Объем генеральной совокупностиN не влияет на объем выборки напрямую, за исключением случаев, когда применяется коэффициент окончательной коррекции совокупности. Возможно, это кажется невероятным, но если подумать, в этом утверждении есть смысл. Например, если исследуемые характеристики всех элементов совокупности идентичны, то выборки, состоящей из одного элемента, вполне достаточно, чтобы рассчитать среднее. Это также правильно, если совокупность состоит из 50, 500, 5000 или 50 000 элементов. В то же время изменчивость характеристик совокупности напрямую влияет на объем выборки. Эта изменчивость учитывается при вычислении объема выборки с помощью генеральной дисперсииQ2 или выборочной дисперсииs2.

Метод доли:

Если изучаемая статистика представлена не средним, а долей, то маркетолог определяет объем выборки аналогичным образом. Предположим, что исследователя интересует установление доли семей, владеющих кредитной карточкой универмага. Порядок действий будет следующим.

1. Укажите степень точности. Предположим, желательная степень точности такова, что допустимый интервал установлен на уровнеD = р — л = ±0,05.

2. Укажите уровень достоверности. Предположим, что желателен 95%-ный уровень достоверности.

3. Определите значениеz, связанное с данным уровнем достоверности. Как объяснялось при расчете среднего, оно составит 1,96.

4. Определите генеральную долю п. Как мы указывали раньше, ее можно получить из вторичных источников, в ходе экспериментального исследования или на основе мнения исследователя. Предположим, что на основе вторичных данных исследователь делает предположение, что 64% семей из изучаемой генеральной совокупности обладают кредитной карточкой универмага. Следовательно, л = 0,64.

5. Определите объем выборки с помощью формулы стандартной ошибки доли:

Или

В нашем примере

(округленное в большую сторону до целого числа).

6. Если конечный объем выборки составляет 10% и больше от объема совокупности, применяется окончательная коррекция совокупности (fpc).Затем необходимый объем выборки рассчитывается по формуле

гдеn — объем выборки до применения окончательной коррекции;nс — объем выборки после применения окончательной коррекции.

7. Если расчет тс был неверным, то доверительный интервал будет более или менее точным по сравнению с необходимым. Предположим, что по окончании выборки рассчитывается значение долиp, равное 0,55. Затем повторно вычисляется доверительный интервал, при этомsp используется для расчета неизвестногоQp , а именно:

Где

В нашем примере

Доверительный интервал тогда равен 0,55 ± 1,96 (0,0264) = 0,55 + 0,052, что означает, что он шире, чем было задано. Это объясняется тем, что среднеквадратичное отклонение выборкиp = 0,55 оказалось большим, чем предположительное значение среднеквадратичного отклонения генеральной совокупности при л = 0,64.

Если интервал, превышающий указанный, недопустим, объем выборки можно скорректировать так, чтобы отразить максимально возможное отклонение в генеральной совокупности. Такое отклонение происходит, когда произведение л (1 — л) достигает максимального значения, для чего л должно равняться 0,5. К этому выводу можно прийти и без расчетов. Поскольку у одной половины совокупности одно значение характеристики, а у другой — другое, потребуется больше данных, чтобы сделать правильный вывод, нежели когда ситуация более четко определена и у большинства элементов одно значение характеристики.В нашем примере это приведет к получению объема выборки, равного

(округлено в большую сторону до целого числа).

8. Иногда точность определена в относительных, а не в абсолютных показателях. Другими словами, может быть известно, что результат вычисления должен составить плюс-минусR% от доли совокупности. Это означает, чтоD =Rл. В этом случае объем выборки можно определить как

   4  Типы плана выборочного контроля

Все техники контроля выборки могут быть разделены на две категории: наблюдение завероятностными и за детерминированными (квотными) выборками. В вероятностную выборку каждый член совокупности может включаться с некой заданной ненулевойвероятностью. Вероятности включения в выборку тех или иных членов совокупности могут отличаться друг от друга, но вероятность включения в нее каждого элемента известна. Эта вероятность определяется особой механической процедурой, используемой для отбора элементов выборки.

Для детерминированных выборок оценка вероятности включения любого элемента в выборку становится невозможной. Гарантировать репрезентативность такой выборки нельзя. Например, все зарегистрированные избиратели с какой-то вероятностью могут быть призваны для участия в суде присяжных. Если бы все заседатели отбирались случайным образом, жюри присяжных представляло бы собой пример вероятностной выборки. Однако ни для кого не секрет, что подбор присяжных заседателей — вещь, мягко говоря, непростая. Ответчик платит своему поверенному в том числе и за его или ее умение подбирать потенциально «дружественное» жюри. Стало быть, жюри является образчиком детерминированной выборки.

Все детерминированные выборки основаны скорее на частной позиции, суждении или предпочтении, а не на механической процедуре отбора элементов выборки. Подобные предпочтения порой могут давать хорошие оценки характеристик совокупности, однако не существует способа объективного определения соответствия выборки поставленной задаче. Оценка точности результатов выборки может быть произведена только в том случае, если были известны вероятности.

  5  Вероятностные выборки

Простая вероятностная выборка:

Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. На основе списка генеральной совокупности составляются карточки с номерами респондентов. Они помещаются в колоду, перемешиваются и из них наугад вынимается карточка, записывается номер, потом возвращается обратно. Далее процедура повторяется столько раз, какой объём выборки нам необходим.

Минус выборки — повторение единиц отбора.

Процедура построения простой случайной выборки включает в себя следующие шаги:

1. необходимо получить полный список членов генеральной совокупности и пронумеровать этот список.

2. определить предполагаемый объем выборки, то есть ожидаемое число опрошенных;

3. извлечь из таблицы случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел. Эти случайные числа могут генерироваться компьютерной программой.

4. выбрать из списка-основы те наблюдения, номера которых соответствуют выписанным случайным числам

Простая случайная выборка:

Данная выборка имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования можно распространять на изучаемую совокупность. Большинство подходов к получению статистических выводов предусматривают сбор информации с помощью простой случайной выборки. Однако метод простой случайной выборки имеет как минимум четыре существенных ограничения:

1. зачастую сложно создать основу выборочного наблюдения, которая позволила бы провести простую случайную выборку.

2. результатом применения простой случайной выборки может стать большая совокупность, либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных.

3. результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов.

4. хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них крайне некорректно представляют изучаемую совокупность. Вероятность этого особенно велика при небольшом объеме выборки.

Простая бесповторная выборка:

Процедура построения данной выборки аналогична предыдущей, только карточки с номерами респондентов не возвращаются обратно в колоду.

Систематическая вероятностная выборка:

Является упрощенным вариантом простой вероятностной выборки. На основе списка генеральной совокупности через определённый интервал (К) отбираются респонденты. Величина К определяется случайно. Наиболее достоверный результат достигается при однородной генеральной совокупности, иначе возможны совпадение величины шага и каких-то внутренних циклических закономерностей выборки (смешение выборки).

Минусы: такие же, как и в простой вероятностной выборке.

Серийная (гнездовая) выборка:

Единицы отбора представляют собой статистические серии (семья, школа, бригада и т. п.). Отобранные элементы подвергаются сплошному обследованию. Отбор статистических единиц может быть организован по типу случайной или систематической выборки.

Минус: Возможность большей однородности, чем в генеральной совокупности.

Районированная выборка:

В случае неоднородной генеральной совокупности, прежде, чем использовать вероятностную выборку с любой техникой отбора, рекомендуется разделить генеральную совокупность на однородные части, такая выборка называется районированной. Группами районирования могут выступать как естественные образования (например, районы города), так и любой признак, заложенный в основу исследования. Признак, на основе которого осуществляется разделение, называется признаком расслоения и районирования.

«Удобная» выборка: Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки — с группой студентов, спортивной командой, с друзьями и соседями. Если необходимо получить информацию о реакции людей на новую концепцию, такая выборка вполне обоснована. «Удобную» выборку часто используют для предварительного тестирования анкет.

  6  Неслучайные (детерминированные) выборки

Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д.

Квотная выборка:

Такая выборка строится как модель, которая воспроизводит структуру генеральной совокупности в виде квот (пропорций) изучаемых признаков. Число элементов выборки с различным сочетанием изучаемых признаков определяется с таким расчётом, чтобы оно соответствовало их доле (пропорции) в генеральной совокупности. Так, например, если генеральная совокупность у нас представлена 5000 человек, из них 2000 женщин и 3000 мужчин, тогда в квотной выборке у нас будут 20 женщин и 30 мужчин, либо 200 женщин и 300 мужчин. Квотированные выборки чаще всего основываются на демографических критериях: пол, возраст, регион, доход, образование и прочих.

Плюсы: обычно такие выборки репрезентативны.

Минусы: применение данного способа построения выборки возможно при наличии достаточно полной информации о генеральной совокупности.

Метод снежного кома:

Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)

Стихийная выборка:

Выборка так называемого «первого встречного». Часто используется в теле- и радиоопросах. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов.

Минусы: невозможно установить какую генеральную совокупность представляют опрошенные, и как следствие – невозможность определить репрезентативность.

Маршрутный опрос:

Часто используется, если единицей изучения является семья. На карте населённого пункта, в котором будет производиться опрос, нумеруются все улицы. С помощью таблицы (генератора) случайных чисел отбираются большие числа. Каждое большое число рассматривается как состоящее из 3-х компонентов: номер улицы (2-3 первых числа), номер дома, номер квартиры. Например, число 14832: 14 – это номер улицы на карте, 8 – номер дома, 32 – номер квартиры.

Районированная выборка с отбором типичных объектов:

Если после районирования из каждой группы отбирается типичный объект, т.е. объект, который по большинству изучаемых в исследовании характеристик приближается к средним показателям, такая выборка называется районированной с отбором типичных объектов.

   7  Стратифицированная выборка

Стратифицированная выборка — вероятностная выборка, формируемая в результате процедуры, состоящей из двух шагов:

генеральная совокупность делится на ряд непересекающихся, исчерпывающих ее подмножеств;

в каждом подмножестве или группе производится независимый отбор элементов простых случайных выборок.

Обратите внимание, что в данном определении ничего не говорится о том, какие критерии используются для деления генеральной совокупности на подмножества. Причина в том, что принадлежность выборки к стратифицированному типу определяется отнюдь не этими критериями. Они влияют скорее на представительность данной обследуемой выборки. Стратифицированная выборка — выборка, отбор элементов которой происходит в два этапа, суть которых указана выше. Это позволяет отличать стратифицированные выборки от групповых.

Подмножества, на которые подразделяется генеральная совокупность, именуются слоями или частными совокупностями. Данное нами определение требует, чтобы выделяемые подмножества не пересекались и исчерпывали исходную совокупность. Это означает, что каждый элемент совокупности должен входить в один и только один из слоев; при этом процедура распределения должна охватывать все без исключения элементы генеральной совокупности.

Одно из преимуществ стратифицированной выборки — такая выборка обеспечивает большую точность выборочных статистик, нежели простая случайная выборка. Если количественным признаком стратификации будет образование, количество выборочных средних, сильно отклоняющихся от генерального среднего, существенно сократится.

Второй довод в пользу стратифицированных выборок состоит в том, что разделение позволяет обследовать интересующие исследователя характеристики определенных подмножеств. Так, при стратификации можно гарантировать представление лиц с образованием не выше среднего и с образованием выше среднего. Эта возможность приобретает особую значимость при отборе элементов генеральной совокупности, включающей в себя редкие сегменты. Представим, например, что производитель колец с бриллиантами хочет изучить социальный состав потребителей его продукции. Если не будут приняты специальные меры, окажется, что высшие слои общества, составляющие всего около 3 % населения, либо вообще не будут представлены в выборке, либо окажутся представленными недостаточно полно. Тем не менее, производителя ювелирных изделий должны интересовать именно они.

В маркетинге возможны ситуации, когда поведение популяции, — например, уровень потребления некой продукции — определяется ее небольшим подмножеством. В этих случаях становится критичным адекватное представление этого подмножества в обследуемой выборке. Стратифицированное выборочное наблюдение является одним из вариантов обеспечения названного представления.

Делая предпочтение стратифицированной выборке по отношению к простой случайной, следует находить разумный компромисс между стоимостью и точностью. Хотя стратифицированные выборки обычно дают более точные оценки, они имеют и большую стоимость. Если исследователь все-таки останавливается на стратифицированной выборке, ему надлежит сделать выбор между пропорционально и непропорционально стратифицированными выборками.

Пропорционально стратифицированная выборка — стратифицированная выборка, в которой межслойное соотношение наблюдений пропорционально относительной доле элементов в каждом слое генеральной совокупности.

Непропорционально стратифицированная выборка — стратифицированная выборка, в которой объем отдельных слоев или подмножеств зависит от объема и изменчивости соответствующих слоев генеральной совокупности.

Слои с большей изменчивостью количественного признака получают в выборке большее, а слои, близкие к гомогенности — меньшее представление, нежели в пропорционально стратифицированной выборке.

В пропорционально стратифицированной выборке наблюдения распределены между слоями пропорционально относительной доле элементов в каждом слое генеральной совокупности. Например, страта, содержащая  часть всех элементов генеральной совокупности, должна быть представлена в общей выборке частью наблюдений.

Преимущество пропорционального распределения состоит в том, что исследователю достаточно знать только относительные размеры каждой страты для определения количества выборочных наблюдений, которые должны быть отобраны из каждого данного объема выборки. Тем не менее, непропорционально стратифицированная выборка может давать еще более точные результаты. При ее составлении повременно учитываются два критерия: объем страты и ее изменчивость. При фиксированном объеме выборки слои с большей изменчивостью получают в общей выборке представление, доля которого превышает — относительный размер в генеральной совокупности.

Непропорционально стратифицированная выборка предполагает лучшее знакомство с генеральной совокупностью, чем пропорционально стратифицированная. Для послойного отбора пропорционально внутристратной изменчивости необходимо знать величину относительной изменчивости. Теория формирования выборок — особая область, в которой знание порождает знание. Непропорционально стратифицированные выборки могут дать большую точность результатов, чем пропорционально стратифицированные; однако первый метод наблюдений предполагает возможность оценки относительной вариации количественного признака в слое. Порой предыдущие исследования и опыты позволяют сделать вывод об относительной гомогенности той или иной страты. Иногда при определении объема выборки для каждого слоя исследователю приходится полагаться на логику или интуицию. Скажем, мы вправе предположить, что для крупных предприятий розничной торговли будет характерна большая изменчивость, чем для малых. Соответственно, при определении розничного индекса Нильсена крупные магазины представлены большей долей.

Неопытные исследователи порой путают стратифицированные выборки с квотными. И действительно, у тех и у других есть ряд сходств. В обоих случаях генеральная совокупность делится на сегменты, и элементы отбираются из каждого сегмента. Но между ними существует существенное различие. В стратифицированных выборках элементы выборки выбираются вероятностным методами; что касается элементов квотных выборок, то их отбор обусловлен позицией исследователя. Это отличие приводит к ряду важных следствий. Поскольку элементы стратифицированной выборки отбираются вероятностным методом, исследователь может установить выборочное распределение изучаемой статистики и, соответственно, оценить величину доверительного интервала. При работе с пропорциональной выборкой мы не можем объективно оценить величину ошибки выборочного обследования. Отсюда, мы не можем оценить величину доверительного интервала и определить статистические критерии значимости.

8  Групповая выборка

Групповые (кластерные) выборки — еще один способ вероятностного выборочного обследования, часто применяемый специалистами. Групповой выборочный отбор в чем-то похож, а чем-то отличается от стратифицированного выборочного отбора. Он предполагает реализацию следующих этапов:

Генеральная (исходная) совокупность делится на ряд непересекающихся исчерпывающих ее подмножеств (кластеров).

Производится случайный отбор подмножеств. Если при формировании выборки исследователь использует все элементы генеральной совокупности, входящие в отобранные подмножества, процедура именуется одноступенчатым групповым выборочным отбором. Если же выборка отбирается из этих подмножеств при помощи вероятностного метода, процедура носит название двухступенчатого группового выборочного отбора.

Обратите внимание на сходства и различия групповой и стратифицированной выборки. Хотя в каждом случае генеральная совокупность делится на ряд непересекающихся, исчерпывающих ее подмножеств, в стратифицированной выборке производится отбор элементов из каждого подмножества. При групповой выборке производится отбор подмножеств.

Вспомните, что при стратифицированной выборке генеральная совокупность подразделялась на слои, количественная характеристика внутри которых стремилась к гомогенности. При групповой же выборке необходимо сформировать подобные подмножества, которые, вместе с тем, являлись бы уменьшенной моделью генеральной совокупности. Каждый кластер должен отражать все многообразие элементов исходной совокупности.

На практике кластеры далеко не всегда получаются максимально гетерогенными. Порой определяемые группы оказываются скорее гомогенными, чем гетерогенными по отношению к обследуемому количественному признаку. Начинающие исследователи зачастую ошибочно называют эту процедуру стратифицированной выборкой, поскольку она предполагает формирование гомогенных подмножеств элементов исходной совокупности. Однако никогда не следует забывать, что следующее за ней формирование выборки основано на случайном выборе подмножеств и ясно указывает именно на ее групповой характер, каким бы ни было при этом деление генеральной совокупности на подмножества. Заметим попутно, что с позиций статистической эффективности гомогенные подмножества являют собой менее удачные выборки, чем гетерогенные.

Статистическая эффективность — относительная характеристика, позволяющая сравнивать различные методы выборочного отбора. При неизменном объеме выборки большую статистическую эффективность будет иметь метод, имеющий меньшую среднеквадратическую ошибку. Если, например, обследуемым количественным признаком является среднее, то наиболее статистически эффективной будет выборка, обеспечивающая минимальное значение среднеквадратической ошибки среднего. Групповые выборки обычно менее статистически эффективны, чем аналогичные стратифицированные или даже простые случайные выборки, поскольку значение максимально возможной ошибки для выборки фиксированного размера достигается именно на них.

И, все-таки, несмотря на свою низкую статистическую эффективность, групповая выборка является одним из основных методов крупномасштабного обследования с использованием персонального опроса (особенно опроса на дому). Почему? Да потому что групповая выборка зачастую оказывается более экономически эффективной — стоимость опроса в этом случае ниже, чем при использовании других методов.

    9  Другие типы вероятностного выборочного отбора

До сих пор при рассмотрении проблемы определения объема выборки мы говорили исключительно о простых случайных выборках. Однако вы должны понимать, что существуют формулы расчета объема выборки и для других типов выборочного отбора. Эти формулы куда более сложны, но они основаны на тех же принципах. При этом вам должно быть известно выборочное распределение статистики, а также заданный уровень точности и степень достоверности результатов.

Определение объема выборки осложняется тем, что здесь мы работаем с рядом слоев или групп. Если при работе с простой случайной выборкой достаточно знать общую генеральную изменчивость, то здесь определение объема выборки предполагает знание внутрислоевой, межслоевой и межгрупповой изменчивости. Как и прежде, чем больше степень изменчивости слоя или группы, тем большей должна быть и выборка. Именно этот факт и является основой непропорционально стратифицированного выборочного отбора.

Не следует забывать и о стоимостном факторе. Ценовой показатель не входит в формулу для определения объема простой случайной выборки, но пренебречь им зачастую просто невозможно. Если стоимость обследования выборки превысит бюджет исследовательской программы, исследователю не останется ничего иного, как только сократить объем выборки, сделав его меньше расчетного. На практике объем простой случайной выборки нередко определяется путем деления суммы, отпущенной для проведения обследования, на условную себестоимость одного наблюдения, пусть с позиций строгой статистики подобный подход и представляется варварским.

При рассмотрении стратифицированных или групповых выборок стоимостной фактор играет еще более существенную роль. Себестоимость одного наблюдения для разных слоев или групп может оказаться разной, и этот момент следует обязательно учесть при постановке задачи и предварительном определении бюджета исследования. Исследователю необходимо найти разумный компромисс между качеством результатов и их стоимостью. Например, в стратифицированной выборке с одинаковой, не зависящей от принадлежности к тому или к иному слою себестоимостью наблюдений следует полнее всего представлять тот слой, для которого характерна наибольшая изменчивость признака. Если же внутрислойная изменчивость оказывается небольшой, а себестоимость наблюдений существенно изменяется от слоя к слою, возможно отдать предпочтение элементам того слоя, для которого она является наименьшей. Поскольку одинаковая себестоимость или внутрислойная изменчивость крайне маловероятны, вам в любом случае придется решать проблему объема выборки вместе с проблемой оптимального послойного или группового отбора.

И для стратифицированных, и для групповых выборок существуют особые расчетные формулы, знание которых необходимо разве что специалистам. Мы не будем приводить их, поскольку все эти зависимости можно найти в стандартных руководствах по теории проектирования выборок. Единственное, на что мы обратим ваше внимание: при рассмотрении стратифицированных и групповых выборок себестоимость наблюдения входит непосредственно в формулу расчета объема выборки.

Следует помнить и о том, что существуют особые формулы для определения объема выборки при проверке гипотез. Им подлежит тот же принцип, но в рассмотрение вводятся и такие дополнительные соображения, как допустимый уровень ошибокI иII типа, и необходимость рассмотрения только грубых или же и грубых, и тонких различий. Эти формулы, которые также можно найти в стандартных руководствах.

    10 Определение объема выборки с использованием предполагаемой перекрестной классификации

При обсуждении стратифицированных и групповых выборок мы говорили о том, что объем выборки зависит от бюджета исследования и себестоимости одного наблюдения. Помимо прочего, на него могут влиять и некие чисто субъективные соображения. Скажем, исследователи могут обнаружить, что расчетный объем выборки превышает статически необходимый объем, достаточный для убеждения ничего не смыслящих в теории выборочных наблюдений администраторов в достоверности полученных результатов.

Одна из важнейших практических основ для определения объема выборки — перекрестная классификация, которую исследователи планируют использовать для упорядочения данных. Предположим, мы хотим оценить долю всех рыболовов, выезжавших на рыбалку с ночевкой хотя бы один раз в течение года, и соотнести эту долю с возрастом и уровнем доходов рыболовов. Примем к рассмотрению следующие возрастные категории: моложе 20 лет, 20 — 29, 30 — 39, 40 — 49 и не моложе 50 лет. Уровень доходов разделим на категории: менее $10000, $10000 — $19999, $20000 — $29999, $30000 — $39999 и свыше $40000. Таким образом, означенная доля должна быть соотнесена с пятью возрастными категориями и с пятью категориями, учитывающими уровень доходов.

Мы можем рассчитать доли отдельно для каждого признака, учитывая их известную взаимозависимость, выражающуюся в том, что уровень доходов, как правило, повышается с возрастом. Для учета названной взаимозависимости мы должны рассматривать одновременно оба этих признака. С этой целью составляется перекрестная классификационная таблица, в которой возраст и уровень доходов соответствуют тем или иным классификационным ячейкам таблицы.

До сих пор мы подходили к проблеме определения объема выборки с чисто статистических позиций, при этом особый акцент делался на соответствующей ошибке выборки и компромиссе между доверительным уровнем и степенью точности. Мы ограничивались рассмотрением этих факторов, поскольку теоретически для оценки требуемого объема выборки может быть применено обратное рассуждение. Вначале исследователь определяет количество ячеек в таблице предполагаемой перекрестной классификации. Это количество определяется как произведение чисел классификационных уровней того и другого признаков. В нашем случае исследователь перемножит пять возрастных и пять «доходных» уровней и получит 25 ячеек. Если минимальное количество наблюдений на ячейку будет определено равным 30, мы получим выборку объемом 750 единиц. Поскольку вероятность равномерного распределения элементов этой выборки между ячейками крайне мала, исследователю необходимо предварительно определить распределение элементов выборки. После выделения наиболее важных ячеек исследователь может определить требуемый объем выборки, обеспечивающий заданную точность и достоверность результатов. Следует взять за правило следующие требования: «объем выборки должен обеспечивать не менее 100 наблюдений для каждой первостепенной и не менее 20-50 наблюдений для каждой второстепенной классификационной составляющей». Первостепенные классификационные составляющие соответствуют наиболее критичным, а второстепенные — наименее критичным ячейкам перекрестной классификации, принятой в данном обследовании.

При этом следует сделать поправку на неполучение данных, поскольку отдельные индивиды, включенные в выборку, окажутся вне пределов досягаемости или откажутся участвовать в обследовании. Таким образом, исследователь «выстраивает» выборку по классификационной таблице, учитывая как специфику совокупности, так и специфику классификации.

Возможно, перекрестная классификация не будет избрана в качестве основного метода для анализа данных. Для этого могут использоваться другие статистические способы. Тем не менее, подобную аргументацию можно использовать и в этом случае. Количество наблюдений должно соответствовать требованиям применяемого метода, только в этом случае результаты будут обладать потребной достоверностью. Различные способы требуют использования различных объемов выборки, часто выражаемых степенью свободы, потребной для проведения анализа. Намеревающиеся использовать для анализа определенную статистическую технику, должны обратить особое внимание на соответственные требования к объему выборки. Все исследовательские стадии тесно связаны между собой, и решения, принимаемые на определенной стадии, могут сказаться на других стадиях. Соответственно, прежде чем приступать к процессу сбора данных, исследователю необходимо тщательно продумать все аспекты обследования, включая и метод анализа данных.

СПИСОК ЛИТЕРАТУРЫ

1. Андрейчиков, А.В. Системный анализ и синтез стратегических решений в инноватике: Основы стратегического инновационного менеджмента и маркетинга / А.В. Андрейчиков, О.Н. Андрейчикова. - М.: Книжный дом Либроком, 2012. - 248 c.

2. Андрейчиков, А.В. Системный анализ и синтез стратегических решений в инноватике: Основы стратегического инновационного менеджмента и маркетинга: Учебное пособие / А.В. Андрейчиков, О.Н. Андрейчикова. - М.: ЛИБРОКОМ, 2013. - 248 c.

3. Андрейчиков, А.В. Системный анализ и синтез стратегических решений в инноватике: Основы стратегического инновационного менеджмента и маркетинга / А.В. Андрейчиков, О.Н. Андрейчикова. - М.: Книжный дом Либроком, 2013. - 248 c.

4. Андрейчиков, А.В. Системный анализ и синтез стратегических решений в инноватике: ОСНОВЫ СТРАТЕГИЧЕСКОГО ИННОВАЦИОННОГО МЕНЕДЖМЕНТА И МАРКЕТИНГА / А.В. Андрейчиков, О.Н. Андрейчикова. - М.: Книжный дом Либроком, 2015. - 248 c.

5. Березкина, Т.Е. Основы маркетинга. Практикум. / Т.Е. Березкина, О.А. Березкина. - М.: Высшая школа, 2006. - 192 c.

6. Власова, В.М. Основы маркетинга: учебное пособие / В.М. Власова, Э.И. Крылов, К.В. Лосев, Л.С. Воробьева. - СПб.: ГУАП, 2008. - 212 c.

7. Голубицкая, Е. Основы маркетинга в телекоммуникациях. / Е. Голубицкая, Е.Г. Кухаренко. - М.: Радио и Связь, 2005. - 320 c.

8. Голубицкая, Е.А. Основы маркетинга в телекоммуникациях / Е.А. Голубицкая, Е.Г. Кухаренко. - М.: РиС, 2005. - 320 c.

9. Голубицкая, Е.А. Основы маркетинга в телекоммуникацих. Учебное пособие для вузов. / Е.А. Голубицкая, Е.Г. Кухаренко. - М.: Горячая линия -Телеком , 2005. - 320 c.

10. Голубков, Е.П. Основы маркетинга. 3-е изд., перер и доп / Е.П. Голубков. - М.: Финпресс, 2008. - 704 c.

11. Жуликов, П.П. Основы маркетинга / П.П. Жуликов, Ю.В. Старцева. - М.: Книжный дом Либроком, 2009. - 248 c.

12. Ильяшенко, В.В. Основы маркетинга и консалтинга в сфере образования / В.В. Ильяшенко. - М.: КноРус, 2012. - 336 c.

13. Котерова, Н.П. Основы маркетинга: Учебное пособие для начального профессионального образования / Н.П. Котерова. - М.: ИЦ Академия, 2009. - 144 c.

14. Котлер, Ф. Основы маркетинга. Краткий курс: Пер. с англ. / Ф. Котлер. - М.: Вильямс, 2011. - 496 c.

15. Котлер, Ф. Основы маркетинга. Краткий курс: Пер. с англ. / Ф. Котлер. - М.: Вильямс, 2012. - 496 c.

16. Котлер, Ф. Основы маркетинга. Краткий курс / Ф. Котлер. - М.: Вильямс, 2016. - 496 c.

17. Котлер, Ф. Основы маркетинга / Ф. Котлер, Г. Армстронг, В. Вонг; Пер. с англ. А.В. Назаренко, А.Н. Свирид . - М.: Вильямс, 2013. - 752 c.

18. Котлер, Ф. Основы маркетинга. 5-е европейское изд / Ф. Котлер, А. Гари. - М.: Вильямс, 2015. - 752 c.

19. Котлер, Ф. Основы маркетинга. 5-е изд. / Ф. Котлер, А. Гари. - М.: Вильямс, 2016. - 752 c.

20. Котлер, Ф. Основы маркетинга. Краткий курс / Ф. Котлер. - М.: Вильямс И.Д., 2011. - 496 c.

21. Котлер, Ф. Основы маркетинга, 5-е европейское издание / Ф. Котлер. - М.: Вильямс И.Д., 2012. - 752 c.

22. Кузнецова, Л.В. Основы маркетинга: Учебное пособие / Л.В. Кузнецова, Ю.Ю. Черкасова. - М.: Вузовский учебник, ИНФРА-М, 2013. - 139 c.

23. Мамедов, О.Ю. Основы маркетинга / О.Ю. Мамедов. - М.: КноРус, 2013. - 232 c.

24. Маркевич, А.Л. Основы экономики, менеджмента и маркетинга для морских специальностей рыбопромыслового флота / А.Л. Маркевич. - М.: МОРКНИГА, 2012. - 267 c.

25. Морозов, Ю.В. Основы маркетинга: Учебное пособие / Ю.В. Морозов. - М.: Дашков и К, 2013. - 148 c.

26. Морозов, Ю.В. Основы маркетинга: Учебное пособие, 8-е изд., испр. и доп.(изд:8) / Ю.В. Морозов. - М.: ИТК Дашков и К, 2013. - 148 c.

27. Морозов, Ю.В. Основы маркетинга: Учебное пособие, 8-е изд / Ю.В. Морозов. - М.: Дашков и К, 2016. - 148 c.

28. Морозов, Ю.В. Основы маркетинга: Учебное пособие, 8-е изд.(изд:8) / Ю.В. Морозов. - М.: ИТК Дашков и К, 2016. - 148 c.

29. Пичурин, И.И. Основы маркетинга. Теория и практика. Учеб. пособие. Гриф УМЦ "Профессиональный учебник". / И.И. Пичурин, О.В. Обухов, Н.Д Эриашвили. - М.: ЮНИТИ, 2013. - 383 c.

30. Пичурин, И.И. Основы маркетинга. Теория и практика. Учеб. пособие. / И.И. Пичурин, О.В. Обухов, Н.Д Эриашвили. - М.: ЮНИТИ, 2013. - 383 c.

31. Реброва, Н.П. Основы маркетинга. учебник и практикум для спо / Н.П. Реброва. - Люберцы: Юрайт, 2016. - 277 c.

32. Садченко, К.В. Основы современного международного маркетинга / К.В. Садченко. - М.: ДиС, 2013. - 272 c.

33. Секерин, В.Д. Основы маркетинга: Учебное пособие / В.Д. Секерин. - М.: КноРус, 2013. - 232 c.

34. Цахаев, Р.К. Основы маркетинга / Р.К. Цахаев, Т.В. Муртузалиев. - М.: Экзамен, 2007. - 448 c.

Выборочное исследование на http://mirrorref.ru


1. Выборочное наблюдение

2. Исследование шифратора

3. Исследование СМО с отказами

4. Социологическое исследование

5. ИССЛЕДОВАНИЕ ФУНКЦИЙ

6. ИССЛЕДОВАНИЕ СЕГНЕТОЭЛЕКТРИКА

7. ИССЛЕДОВАНИЕ РЕГИСТРОВ

8. ИССЛЕДОВАНИЕ ФОТОЭЛЕМЕНТОВ

9. Исследование дешифратора

10. Исследование рынков