Стратифицированная случайная выборка: преимущества и недостатки

Когда экспериментаторы или исследователи ищут данные, часто невозможно измерить каждую отдельную точку данных в популяции. Однако статистические методы позволяют делать выводы о совокупности путем анализа результатов меньшей выборки, извлеченной из этой совокупности. Есть несколько методов отбора проб.

Стратифицированная случайная выборка — это один из распространенных методов, используемых исследователями, поскольку он позволяет им получить выборку, которая наилучшим образом представляет всю исследуемую популяцию, обеспечивая представление каждой интересующей подгруппы. Тем не менее, этот метод исследования не лишен недостатков.

Ключевые выводы

  • Стратифицированная случайная выборка позволяет исследователям получить выборку, которая наилучшим образом представляет всю изучаемую совокупность, разделив ее на подгруппы, называемые стратами.
  • Однако этот метод статистической выборки нельзя использовать в каждом дизайне исследования или с каждым набором данных.
  • Стратифицированная случайная выборка отличается от простой случайной выборки, которая включает случайный выбор данных из всей генеральной совокупности, поэтому вероятность появления каждой возможной выборки одинакова.

Стратифицированная случайная выборка: обзор

Стратифицированная случайная выборка включает сначала разделение совокупности на субпопуляции, а затем применение методов случайной выборки к каждой субпопуляции для формирования тестовой группы. Недостатком является то, что исследователи не могут классифицировать каждого члена популяции в подгруппу.

Стратифицированная случайная выборка отличается от простой случайной выборки, которая включает случайный выбор данных из всей генеральной совокупности, так что вероятность появления каждой возможной выборки одинакова. Напротив, стратифицированная случайная выборка делит население на более мелкие группы или страты на основе общих характеристик. Случайная выборка берется из каждой страты прямо пропорционально размеру страты по сравнению с генеральной совокупностью.

Пример стратифицированной случайной выборки

Ниже приводится пример стратифицированной случайной выборки:

Исследователи проводят исследование, призванное оценить политические пристрастия студентов-экономистов крупного университета. Исследователи хотят убедиться, что случайная выборка наилучшим образом соответствует студенческому контингенту, включая пол, студентов и аспирантов. Общее количество учащихся, участвовавших в исследовании, составляет 1000 студентов, из которых создаются подгруппы, как показано ниже.

Общая численность населения = 1000 человек.

Исследователи распределили каждого студента-экономиста в университете в одну из четырех субпопуляций: студенты мужского пола, студентки, выпускники мужского пола и выпускники женского пола. Затем исследователи подсчитают, сколько студентов из каждой подгруппы составляют общую популяцию в 1000 студентов. Оттуда исследователи вычисляют процентное представление каждой подгруппы от общей численности населения. 

Подгруппы:

  • Студенты-мужчины = 450 студентов (из 100) или 45% населения
  • Студентки = 200 студентов или 20%
  • Аспиранты-мужчины = 200 студентов или 20%
  • Аспирантки = 150 студентов или 15%

Произведен случайный отбор каждой субпопуляции на основе ее представительства в популяции в целом. Поскольку студенты-мужчины составляют 45% населения, из этой подгруппы случайным образом выбираются 45 студентов-мужчин. Поскольку выпускники мужского пола составляют лишь 20% населения, для выборки отбираются 20 человек и так далее. 

Краткий обзор

Хотя стратифицированная случайная выборка точно отражает изучаемую популяцию, условия, которые должны быть выполнены, означают, что этот метод не может использоваться в каждом исследовании.

Преимущества стратифицированной случайной выборки

Стратифицированная случайная выборка имеет преимущества по сравнению с простой случайной выборкой.

Точно отражает изучаемую популяцию

Стратифицированная случайная выборка точно отражает изучаемую совокупность, потому что исследователи расслаивают всю совокупность перед применением методов случайной выборки. Короче говоря, это гарантирует, что каждая подгруппа в популяции получит надлежащее представление в выборке. В результате стратифицированная случайная выборка обеспечивает лучший охват населения, поскольку исследователи контролируют подгруппы, чтобы гарантировать, что все они представлены в выборке. 

При простой случайной выборке нет никакой гарантии, что будет выбрана какая-либо конкретная подгруппа или тип человека. В нашем предыдущем примере со студентами университета использование простой случайной выборки для получения выборки из 100 человек может привести к отбору только 25 студентов мужского пола или только 25% от общей численности населения. Кроме того, могут быть отобраны 35 аспирантов-женщин (35% населения), что приведет к недопредставлению студентов-мужчин и чрезмерному представлению аспирантов-женщин. Любые ошибки в представлении совокупности могут снизить точность исследования.

Недостатки стратифицированной случайной выборки

Стратифицированная случайная выборка также ставит исследователей в невыгодное положение.

Не может использоваться во всех исследованиях

К сожалению, этот метод исследования нельзя использовать во всех исследованиях. Недостатком метода является то, что для его правильного использования необходимо выполнение нескольких условий. Исследователи должны идентифицировать каждого члена изучаемой популяции и классифицировать каждого из них в одну и только одну субпопуляцию. В результате стратифицированная случайная выборка невыгодна, когда исследователи не могут с уверенностью классифицировать каждого члена популяции в подгруппу. Кроме того,  может быть непросто составить исчерпывающий и окончательный список всего населения

Перекрытие может быть проблемой, если есть предметы, которые попадают в несколько подгрупп. Когда выполняется простая случайная выборка, более вероятно, что будут выбраны те, кто входит в несколько подгрупп. Результатом может быть искажение или неточное отображение населения. 

Приведенный выше пример упрощает задачу: студенты, выпускники, мужчины и женщины — это четко определенные группы. Однако в других ситуациях это может быть намного сложнее. Представьте себе включение таких характеристик, как раса, этническая принадлежность или религия. Процесс сортировки становится более сложным, в результате чего стратифицированная случайная выборка становится неэффективным и далеко не идеальным методом.