Как работает стратифицированная случайная выборка

Стратифицированная случайная выборка  — это метод выборки, который включает разделение совокупности на более мелкие группы, называемые стратами. Группы или страты организованы на основе общих характеристик или атрибутов членов группы. Процесс разделения населения на группы называется стратификацией.

Стратифицированная случайная выборка также известна как случайная квотная выборка и пропорциональная случайная выборка. Стратифицированная случайная выборка имеет множество применений и преимуществ, таких как изучение демографии населения и ожидаемой продолжительности жизни.

Ключевые выводы

  • Стратифицированная случайная выборка — это метод выборки, который включает в себя выборку из совокупности, разделенной на более мелкие группы, называемые стратами.
  • Стратифицированная случайная выборка включает случайную выборку из стратифицированных групп пропорционально генеральной совокупности.
  • Стратифицированная случайная выборка — более точный показатель, поскольку он лучше отражает генеральную совокупность.

Понимание стратифицированной случайной выборки

Стратифицированная случайная выборка делит население на подгруппы. Случайные выборки отбираются в одинаковой пропорции к совокупности из каждой группы или страты. Члены в каждой сформированной страте (единственное число для страты) имеют схожие атрибуты и характеристики.

Стратифицированная случайная выборка — это метод выборки, при котором исследователь выбирает небольшую группу в качестве размера выборки для исследования. Это подмножество представляет большую популяцию. Разделение популяции на группы со схожими характеристиками помогает исследователям сэкономить время и деньги, когда изучаемая популяция слишком велика для анализа на индивидуальной основе. Стратифицированная случайная выборка помогает исследователям организовывать группы на основе схожих характеристик, при этом случайная выборка затем берется из каждой страты или группы.

Стратифицированная случайная выборка может использоваться, например, для изучения результатов голосования на выборах, людей, которые работают сверхурочно, ожидаемой продолжительности жизни, доходов различных групп населения и доходов от различных должностей по всей стране. 

Стратифицированная и упрощенная случайная выборка

Простая случайная выборка является выборкой индивидуумов, которые существуют в популяции которой особи выбираются случайным образом из популяции и помещали в образец. Этот метод случайного отбора людей направлен на выбор размера выборки, который является беспристрастным представлением населения. Однако простая случайная выборка невыгодна, когда выборки совокупности сильно различаются.

И наоборот, стратифицированная случайная выборка разбивает популяцию на подгруппы и организует их по схожим чертам, характеристикам и поведению. В результате стратифицированная случайная выборка более выгодна, когда популяция сильно различается, поскольку она помогает лучше организовать выборки для исследования.

Однако простая случайная выборка более предпочтительна, когда совокупность не может быть разделена на подгруппы из-за слишком большого количества различий внутри совокупности. Кроме того, простые случайные выборки лучше всего подходят, когда информация о популяции практически отсутствует, что не позволяет разбить популяцию на подмножества на основе характеристик или признаков.

Пример стратифицированной случайной выборки

Исследовательская группа решила провести исследование, чтобы проанализировать средние баллы или средний балл для 21 миллиона студентов колледжей в США. Исследователи решили получить случайную выборку из 4000 студентов из 21 миллиона студентов. Команда хочет проверить различные специальности и последующие средние баллы для студентов или участников выборки.

Из 4000 участников разбивка по мажорам выглядит следующим образом:

  • Английский: 560
  • Наука: 1135
  • Информатика: 800
  • Инженерное дело: 1090
  • Математика: 415

У исследователей есть пять слоев в процессе стратифицированной случайной выборки. Затем исследователи изучают данные о населении, чтобы определить процент из 21 миллиона студентов, которые специализируются на предметах из их выборки. Результаты показывают следующее:

  • 12% — английский язык
  • 28% — наука
  • 24% — информатика
  • 21% — инженерное дело
  • 15% по специальности математика

Команда решает использовать пропорциональную стратифицированную случайную выборку, с помощью которой они хотят определить, соответствуют ли профили студентов в выборке той же пропорции, что и население.

Однако пропорции в выборке не равны процентам в генеральной совокупности. Например, 12% студентов изучают английский язык, в то время как 14% студентов в выборке изучают английский язык (или 560 специальностей английского языка / 4000).

В результате исследователи решают пересмотреть выборку студентов, чтобы соответствовать проценту специальностей в популяции. Из 4000 студентов в их выборке они решают случайным образом выбрать следующие:

  • 480 английских специальностей (12% из 4000)
  • 1120 специальностей науки (28% из 4000)
  • 960 специальностей информатики (24% из 4000)
  • 840 инженерных специальностей (21% из 4000)
  • 600 специальностей по математике (15% из 4000)

Теперь у исследователей есть пропорциональная стратифицированная случайная выборка студентов колледжей и их соответствующих специальностей, которая более точно отражает основные направления для всего студенческого населения. Оттуда исследователи могут анализировать средний балл каждой страты, а также их характеристики, чтобы лучше понять, как работает все студенческое население.