Стратифицированная случайная выборка
Что такое стратифицированная случайная выборка?
Стратифицированная случайная выборка — это метод выборки, который включает разделение совокупности на более мелкие подгруппы, известные как страты. При стратифицированной случайной выборке или стратификации страты формируются на основе общих атрибутов или характеристик членов, таких как доход или уровень образования.
Стратифицированная случайная выборка также называется пропорциональной случайной выборкой или квотной случайной выборкой.
Ключевые выводы
- Стратифицированная случайная выборка позволяет исследователям получить выборку, которая наилучшим образом представляет всю исследуемую популяцию.
- Стратифицированная случайная выборка включает разделение всего населения на однородные группы, называемые стратами.
- Стратифицированная случайная выборка отличается от простой случайной выборки, которая включает случайный выбор данных из всей генеральной совокупности, поэтому вероятность появления каждой возможной выборки одинакова.
Как работает стратифицированная случайная выборка
Завершая анализ или исследование группы сущностей со схожими характеристиками, исследователь может обнаружить, что размер популяции слишком велик для проведения исследования. Чтобы сэкономить время и деньги, аналитик может применить более реальный подход, выбрав небольшую группу из совокупности. Небольшая группа называется размером выборки, которая представляет собой подмножество генеральной совокупности, которая используется для представления всей совокупности. Выборка может быть выбрана из совокупности несколькими способами, одним из которых является метод стратифицированной случайной выборки.
Стратифицированная случайная выборка включает разделение всей совокупности на однородные группы, называемые стратами (множественное число от страты). Затем из каждой страты отбираются случайные выборки. Например, рассмотрим академического исследователя, который хотел бы знать, сколько студентов MBA в 2007 году получили предложение о работе в течение трех месяцев после выпуска.
Вскоре он обнаружит, что за год было почти 200 000 выпускников MBA. Он может решить простой случайной выборки из 50000 выпускников и запустить опрос. Более того, он мог разделить совокупность на слои и взять из них случайную выборку. Для этого он создавал группы населения по полу, возрасту, расе, стране национальности и карьере. Из каждой страты отбирается случайная выборка в количестве, пропорциональном размеру страты по сравнению с генеральной совокупностью. Затем эти подмножества страт объединяются для формирования случайной выборки.
[Важно: стратифицированная выборка используется для выявления различий между группами в генеральной совокупности, в отличие от простой случайной выборки, при которой все члены генеральной совокупности рассматриваются как равные с равной вероятностью попадания в выборку.]
Пример стратифицированной случайной выборки
Предположим, исследовательская группа хочет определить средний балл студентов колледжей в США. Исследовательская группа испытывает трудности со сбором данных от всех 21 миллиона студентов колледжей; он решает взять случайную выборку населения, используя 4000 студентов.
Теперь предположим, что команда изучает различные атрибуты участников выборки и задается вопросом, есть ли какие-либо различия в среднем балле и специальностях студентов. Предположим, что было обнаружено, что 560 студентов специализируются на английском, 1135 — на естественных науках, 800 — на компьютерных науках, 1090 — на инженерных специальностях, а 415 — на математических. Команда хочет использовать пропорциональную стратифицированную случайную выборку, в которой слой выборки пропорционален случайной выборке в генеральной совокупности.
Предположим, что группа изучает демографические данные студентов колледжей в США и находит процентное соотношение студентов: 12% — английский, 28% — естественные науки, 24% — информатика, 21% — инженерное дело и 15%. специальность математика. Таким образом, в результате процесса стратифицированной случайной выборки создаются пять страт.
Затем группе необходимо подтвердить, что слой населения пропорционален слою в выборке; однако они находят, что пропорции не равны. Затем команде необходимо повторно выбрать 4000 студентов из населения и случайным образом выбрать 480 студентов, изучающих английский язык, 1120 студентов, изучающих естественные науки, 960 студентов, изучающих информатику, 840 инженеров и 600 студентов, изучающих математику.
Вместе с этим он имеет пропорциональную стратифицированную случайную выборку студентов колледжей, которая обеспечивает лучшее представление о студентах по специальностям колледжа в США. Затем исследователи могут выделить конкретную группу, наблюдать за различными исследованиями студентов колледжей в США и наблюдать за различными средними баллами..
Сравнение простых случайных и стратифицированных случайных выборок
Простые случайные выборки и стратифицированные случайные выборки являются инструментами статистических измерений. Простая случайная выборка используется для представления всей совокупности данных. Стратифицированная случайная выборка делит население на более мелкие группы или страты на основе общих характеристик.
Простая случайная выборка часто используется, когда имеется очень мало информации о совокупности данных, когда совокупность данных имеет слишком много различий, чтобы ее можно было разделить на различные подмножества, или когда среди совокупности данных имеется только одна отличительная характеристика.
Например, кондитерская компания может захотеть изучить покупательские привычки своих клиентов, чтобы определить будущее своей линейки продуктов. Если имеется 10 000 клиентов, он может использовать 100 из них в качестве случайной выборки. Затем он может применить то, что находит от этих 100 клиентов, к остальной части своей базы. В отличие от стратификации, 100 членов будут отбираться случайным образом без учета их индивидуальных характеристик.
Пропорциональное и непропорциональное расслоение
Стратифицированная случайная выборка гарантирует, что каждая подгруппа данной совокупности адекватно представлена во всей выборочной совокупности исследовательского исследования. Стратификация может быть пропорциональной или непропорциональной. В пропорциональном стратифицированном методе размер выборки каждой страты пропорционален размеру генеральной совокупности страты.
Например, если исследователь хотел получить выборку из 50 000 выпускников с использованием возрастного диапазона, пропорциональная стратифицированная случайная выборка будет получена по следующей формуле: (размер выборки / размер популяции) x размер страты. В приведенной ниже таблице предполагается, что количество выпускников MBA составляет 180 000 человек в год.
Размер стратной выборки для выпускников MBA в возрасте от 24 до 28 лет рассчитывается как (50 000/180 000) x 90 000 = 25 000. Тот же метод используется для других возрастных групп. Теперь, когда известен размер страты выборки, исследователь может выполнить простую случайную выборку в каждой страте, чтобы выбрать участников своего опроса. Другими словами, 25 000 выпускников возрастной группы 24–28 лет будут выбраны случайным образом из всего населения, 16 667 выпускников возрастной группы 29–33 лет будут выбраны случайным образом из населения и так далее.
В непропорциональной стратифицированной выборке размер каждой страты не пропорционален ее размеру в генеральной совокупности. Исследователь может выбрать половину выпускников в возрастной группе 34–37 лет и 1/3 выпускников в возрастной группе 29–33 лет.
Важно отметить, что один человек не может поместиться в несколько слоев. Каждая сущность должна соответствовать только одному слою. Наличие перекрывающихся подгрупп означает, что некоторые люди будут иметь более высокие шансы быть отобранными для обследования, что полностью отрицает концепцию стратифицированной выборки как типа вероятностной выборки.
Краткий обзор
Управляющие портфелем могут использовать стратифицированную случайную выборку для создания портфелей путем репликации индекса, такого как индекс облигаций.
Преимущества стратифицированной случайной выборки
Основное преимущество стратифицированной случайной выборки состоит в том, что она отражает ключевые характеристики совокупности в выборке. Подобно средневзвешенному, этот метод выборки дает характеристики в выборке, которые пропорциональны генеральной совокупности. Стратифицированная случайная выборка хорошо работает для популяций с различными атрибутами, но в остальном неэффективна, если невозможно сформировать подгруппы.
Стратификация дает меньшую ошибку в оценке и большую точность, чем простой метод случайной выборки. Чем больше разница между слоями, тем выше точность.
Недостатки стратифицированной случайной выборки
К сожалению, этот метод исследования нельзя использовать во всех исследованиях. Недостатком метода является то, что для его правильного использования необходимо выполнение нескольких условий. Исследователи должны идентифицировать каждого члена изучаемой популяции и классифицировать каждого из них в одну и только одну субпопуляцию. В результате стратифицированная случайная выборка невыгодна, когда исследователи не могут с уверенностью классифицировать каждого члена популяции в подгруппу. Кроме того, может быть непросто составить исчерпывающий и окончательный список всего населения.
Перекрытие может быть проблемой, если есть предметы, которые попадают в несколько подгрупп. Когда выполняется простая случайная выборка, более вероятно, что будут выбраны те, кто входит в несколько подгрупп. Результатом может быть искажение или неточное отображение населения.
Приведенные выше примеры упрощают задачу: студенты, выпускники, мужчины и женщины — это четко определенные группы. Однако в других ситуациях это может быть намного сложнее. Представьте себе включение таких характеристик, как раса, этническая принадлежность или религия. Процесс сортировки становится более сложным, в результате чего стратифицированная случайная выборка становится неэффективным и далеко не идеальным методом.