Систематическая выборка и кластерная выборка: в чем разница?

Систематическая выборка против кластерной выборки: обзор

Систематическая выборка и кластерная выборка — это два разных типа статистических показателей, используемых исследователями, аналитиками и маркетологами для изучения выборки населения.

Способы, которыми как систематическая, так и кластерная выборка отбирают точки выборки из совокупности, различаются. В то время как систематическая выборка использует фиксированные интервалы от большей совокупности для создания выборки, кластерная выборка разбивает совокупность на различные кластеры.

Систематическая выборка выбирает случайную отправную точку из генеральной совокупности, а затем выбирается выборка из регулярных фиксированных интервалов генеральной совокупности в зависимости от ее размера.Кластерная выборка делит совокупность на кластеры, а затем берет простую случайную выборку из каждого кластера.1 В этой статье мы рассмотрим различия обоих этих типов выборок, их преимущества и недостатки, когда лучше использовать одно над другим, и примеры каждого из них.

Ключевые выводы

  • Систематическая выборка и кластерная выборка — это статистические меры, используемые исследователями, аналитиками и маркетологами для изучения выборок населения.
  • Систематическая выборка включает выбор фиксированных интервалов из более широкой совокупности для создания выборки.
  • Кластерная выборка делит совокупность на группы, а затем выбирает случайную выборку из каждого кластера.
  • Как систематическая выборка, так и кластерная выборка являются формами случайной выборки, известной как вероятностная выборка, которая отличается от не вероятностной выборки.
  • Систематическая выборка и кластерная выборка имеют свои преимущества и недостатки, но и то, и другое может быть эффективным с точки зрения времени и затрат.

Систематическая выборка

Систематическая выборка — это метод случайной вероятностной выборки. Это один из самых популярных и распространенных методов, используемых исследователями и аналитиками. Этот метод предполагает отбор образцов из большей группы. Хотя отправная точка может быть случайной, выборка предполагает использование фиксированных интервалов между каждым членом.

Вот как это работает. Исследователь начинает с выбора отправной точки из более широкой популяции. Обычно это целое число, которое должно быть меньше количества субъектов в большей популяции. Затем аналитик выбирает интервал между каждым членом; это постоянное различие между каждым участником. Вот гипотетический пример. Допустим, в исследовании участвует 100 человек. Исследователь начинает с человека на 10-м месте. Затем они решают выбирать каждого седьмого человека после этого. Это означает, что в выборку выбираются люди из следующих мест: 10, 17, 24, 31, 38, 45 и так далее.

Преимущества и недостатки систематического отбора проб

Этот тип статистической выборки довольно прост, поэтому исследователи обычно предпочитают его.Это также очень полезно для определенных целей в области финансов.Те, кто использует этот метод, делают предположение, что результаты представляют большинство нормальных популяций.Этот процесс также гарантирует равномерную выборку всей генеральной совокупности. Но с такой выборкой могут быть проблемы. Например, риск манипулирования данными может быть выше, поскольку те, кто использует этот метод, могут выбирать предметы и интервалы на основе желаемого результата.

Систематический отбор проб прост в проведении и понятен. Статистики, у которых могут быть бюджетные или временные ограничения, считают использование систематической выборки преимуществом с точки зрения создания, сравнения и понимания своих выборок. Кроме того, систематический отбор образцов обеспечивает повышенную степень контроля по сравнению с другими методологиями отбора образцов из-за его процесса.

Систематическая выборка также устраняет кластерный выбор, когда случайно выбранные выборки в генеральной совокупности неестественно близки друг к другу. Случайные выборки, в отличие от систематических, могут устранить это явление только путем проведения нескольких опросов или увеличения количества выборок; и то, и другое может быть трудоемким и дорогостоящим. Систематическая выборка также имеет фактор низкого риска, поскольку вероятность того, что данные могут быть искажены, мала.

Несмотря на множество преимуществ, систематический отбор проб не лишен недостатков. Основное ограничение систематической выборки состоит в том, что необходим размер совокупности. Без определенного количества участников в популяции систематическая выборка не работает. Например, если статистик хотел бы изучить возраст бездомных в конкретном регионе, но не может точно определить количество бездомных, то у них не будет численности населения или отправной точки.

Другой недостаток состоит в том, что в популяции должна быть естественная степень случайности. В противном случае увеличивается риск выбора похожих экземпляров, что противоречит цели выборки.

Пример систематической выборки

Цель систематической выборки — получить объективную выборку. Для этого нужно присвоить номер каждому участнику в генеральной совокупности, а затем выбрать тот же обозначенный интервал в генеральной совокупности для создания выборки.

Например, вы можете выбрать каждого пятого участника или каждого двадцатого участника, но вы должны выбрать одного и того же в каждой группе населения. Процесс выбора этого n-го числа является систематической выборкой.

Например, компания по производству зубной пасты создает новый вкус зубной пасты и хотела бы протестировать ее на выборочной совокупности, прежде чем продавать ее широкой публике. Тест должен определить, хорошо ли воспринимается новый ароматизатор образцом. Компания собирает популяцию из 50 человек и решает использовать систематическую выборку для создания выборки из 10 человек, чье мнение относительно зубной пасты они будут учитывать.

Во-первых, маркетинговая команда присваивает номер каждому участнику в популяции. В этом случае его совокупность составляет 50 человек в группе, поэтому он присваивает каждому участнику номер в диапазоне от 1 до 50. Затем он должен определить, какой размер выборки он хочет иметь, и определил размер выборки в 10. Следовательно, 50/10 = 5. Пять будет цифрой выборки; это означает, что он выберет каждого пятого участника в популяции для получения своей выборки. Это указано в таблице ниже, где каждый пятый участник выделен жирным шрифтом и выбран для выборки.

Выборочное обследование

Кластерная выборка — это еще один тип случайной статистической меры. Этот метод используется, когда в большей популяции присутствуют разные подмножества групп. Эти группы известны как кластеры. Кластерная выборка обычно используется маркетинговыми группами и профессионалами.

Краткий обзор

При попытке изучить демографические характеристики города или района лучше всего использовать кластерную выборку из-за большой численности населения.

Кластерная выборка — это двухэтапная процедура. Сначала отбирается вся совокупность и разделяется на разные кластеры. Затем из этих подгрупп выбираются случайные образцы. Например, исследователю может быть трудно собрать всю совокупность покупателей продуктового магазина для интервью. Однако они могут создавать случайные подмножества магазинов; это представляет собой первый шаг в этом процессе. Второй шаг — опросить случайную выборку покупателей этих магазинов.

Типы кластерной выборки

Существует два типа кластерной выборки: одностадийная кластерная выборка и двухэтапная кластерная выборка.

Одноэтапная кластерная выборка включает выбор случайной выборки кластеров и сбор данных от каждого отдельного субъекта в этом кластере. Двухэтапная кластерная выборка включает случайный выбор нескольких кластеров и случайный выбор определенных субъектов в каждом кластере для формирования окончательной выборки. Двухэтапная выборка может рассматриваться как подмножество одноэтапной выборки: выборка определенных элементов из созданных кластеров.

Преимущества и недостатки кластерной выборки

Этот метод выборки может использоваться, когда составление списка всей генеральной совокупности затруднено, как показано в приведенном выше примере.Это простой ручной процесс, позволяющий сэкономить время и деньги.

Фактически, использование кластерной выборки может быть довольно дешевым по сравнению с другими методами. Это потому, что обычно меньше сопутствующих затрат и затрат, потому что выборка кластеров требует случайного выбора выбранных кластеров, а не оценки всей совокупности. Этот же процесс также позволяет увеличить размер выборки. Поскольку статистик выбирает только из выбранной группы кластеров, он может увеличить количество субъектов для выборки из этого кластера.

Основным недостатком кластерной выборки является то, что с ней связана большая ошибка выборки, что делает ее менее точной, чем другие методы выборки. Это связано с тем, что субъекты в кластере, как правило, имеют схожие характеристики, а это означает, что кластерная выборка не включает различные демографические характеристики населения. Это часто приводит к чрезмерному или недопредставлению в пределах кластера и, следовательно, может быть смещенной выборкой.

Пример кластерной выборки

Например, предположим, что проводится академическое исследование, чтобы определить, сколько сотрудников инвестиционных банков имеют степень магистра делового администрирования, а из числа тех, кто учится в школах Лиги плюща. Статистику будет сложно пойти в каждый инвестиционный банк и спросить у каждого сотрудника об их образовании. Для достижения цели статистик может использовать кластерную выборку.

Первым шагом будет формирование кластера инвестиционных банков. Вместо того, чтобы изучать каждый инвестиционный банк, статистик может выбрать изучение трех крупнейших инвестиционных банков на основе доходов, образуя первый кластер. Отсюда, вместо того, чтобы опрашивать каждого сотрудника во всех трех инвестиционных банках, статистик мог бы сформировать другой кластер, в который вошли бы сотрудники только определенных отделов, например, отдела продаж и торговли или слияний и поглощений.

Этот метод позволяет статистику сузить размер выборки, сделать ее более эффективной и рентабельной, но при этом иметь достаточно разнообразную выборку для оценки искомой информации.

Особые соображения

Хотя как систематическая выборка, так и кластерная выборка являются формами случайной выборки, они достигают своего размера выборки совершенно разными способами. Систематическая выборка выбирает выборку на основе фиксированных интервалов в генеральной совокупности, тогда как кластерная выборка создает кластер из генеральной совокупности.

Кластерная выборка лучше подходит, когда есть разные подмножества в пределах определенной совокупности, тогда как систематическая выборка лучше используется, когда известен весь список или количество генеральной совокупности. Оба, однако, разбивают совокупность на более мелкие единицы для выборки.

Для систематической выборки важно убедиться, что в группе нет закономерностей, в противном случае вы рискуете выбрать похожие предметы, не представляя общую популяцию. Для кластерной выборки важно убедиться, что каждый кластер имеет сходные черты со всей выборкой.

Часто задаваемые вопросы о кластерной выборке

Что означает кластерная выборка?

Кластерная выборка — это форма случайной выборки, которая разделяет совокупность на кластеры для создания выборки. Дальнейшие кластеры могут быть созданы из начальных кластеров, чтобы сузить выборку.

Зачем использовать кластерную выборку?

Кластерная выборка лучше всего используется для изучения больших разрозненных популяций, где опрос каждого субъекта был бы дорогостоящим, трудоемким и, возможно, невозможным. Кластерная выборка позволяет создавать кластеры, которые являются меньшим представлением оцениваемой совокупности со схожими характеристиками.

Как работает кластерная выборка?

Кластерная выборка просто включает разделение изучаемой совокупности на более мелкие группы. Эти подгруппы могут быть изучены или в дальнейшем случайным образом разделены на другие подгруппы.

В чем разница между кластерной и стратифицированной выборкой?

Основное различие между кластерной выборкой и стратифицированной выборкой состоит в том, что кластеры, созданные в кластерной выборке, неоднородны, тогда как группы для стратифицированной выборки однородны.

Суть

Есть целый различные методы отбора образцов, доступных для статистиков, которые стремятся изучать информацию в группах. Поскольку группы или популяции имеют тенденцию быть большими, очень трудно получить данные от каждого отдельного субъекта. Чтобы преодолеть эту проблему, статистики используют выборку, создавая более мелкие группы, которые должны быть репрезентативными для большей совокупности.

Важным аспектом создания этих меньших выборок является обеспечение того, чтобы они были выбраны случайным образом и достоверно отражали большую совокупность. Систематическая выборка и кластерная выборка — это два метода, которые статистики могут использовать для изучения популяций.

Обе формы случайной выборки могут быть эффективными по времени и затратам, разделяя популяции на более мелкие группы для облегчения анализа. Систематическая выборка работает лучше всего, когда известна вся генеральная совокупность, в то время как кластерная выборка работает лучше всего, когда всю генеральную совокупность трудно измерить.