Простая случайная и стратифицированная случайная выборка: в чем разница?

Простая случайная и стратифицированная случайная выборка: обзор

В статистическом анализе « совокупность » — это совокупность существующих наблюдений или данных. Однако часто невозможно измерить каждого человека или точку данных в популяции. Вместо этого исследователи полагаются на образцы. Образец представляет собой набор наблюдений с населения. Метод отбора проб — это процесс, используемый для отбора проб из совокупности.

Простые случайные выборки и стратифицированные случайные выборки являются общими методами получения выборки. Простая случайная выборка используется для представления всей совокупности данных и случайным образом выбирает людей из совокупности без каких-либо других соображений.

С другой стороны, стратифицированная случайная выборка сначала делит совокупность на более мелкие группы или страты на основе общих характеристик. Следовательно, стратегия стратифицированной выборки гарантирует, что члены каждой подгруппы будут включены в анализ данных.

Ключевые выводы

  • Простые случайные и стратифицированные случайные выборки являются инструментами статистических измерений.
  • Простая случайная выборка берет небольшую базовую часть всей генеральной совокупности для представления всего набора данных.
  • Население делится на разные группы, которые имеют схожие характеристики, из которых берется стратифицированная случайная выборка.

Простая случайная выборка

Простая случайная выборка — это статистический инструмент, используемый для описания очень простой выборки, взятой из совокупности данных. Этот образец представляет собой эквивалент всего населения.

Простая случайная выборка часто используется, когда имеется очень мало информации о совокупности данных, когда совокупность данных имеет слишком много различий, чтобы ее можно было разделить на различные подмножества, или когда среди совокупности данных имеется только одна отличительная характеристика.

Например, кондитерская компания может захотеть изучить покупательские привычки своих клиентов, чтобы определить будущее своей линейки продуктов. Если имеется 10 000 клиентов, он может использовать 100 из них в качестве случайной выборки. Затем он может применить то, что находит от этих 100 клиентов, к остальной части своей базы.

Статистики составят исчерпывающий список совокупности данных, а затем выберут случайную выборку из этой большой группы. В этой выборке каждый член населения имеет равные шансы быть выбранным для участия в выборке. Их можно выбрать двумя способами:

  • Через ручную лотерею, в которой каждому члену населения присваивается номер. Затем кто-то произвольно выбирает числа для включения в выборку. Лучше всего использовать это при просмотре небольшой группы.
  • Компьютерная выборка. Этот метод лучше всего работает с большими наборами данных, когда для отбора образцов используется компьютер, а не человек.

Использование простой случайной выборки позволяет исследователям делать обобщения о конкретной популяции и не учитывать никаких предубеждений. Это может помочь определить, как принимать решения в будущем. Таким образом, компания по производству конфет из приведенного выше примера может использовать этот инструмент для разработки нового вкуса конфет для производства на основе текущих вкусов 100 клиентов. Но имейте в виду, что это обобщения, поэтому здесь есть место для ошибок. Ведь это простой образец. Эти 100 клиентов могут не иметь точного представления о вкусах всего населения.

Стратифицированная случайная выборка

В отличие от простых случайных выборок, стратифицированные случайные выборки используются с популяциями, которые можно легко разбить на различные подгруппы или подмножества. Эти группы основаны на определенных критериях, затем случайным образом выбираются элементы из каждой пропорционально размеру группы по сравнению с населением.

Этот метод выборки означает, что будет выборка из каждой отдельной группы, размер которой зависит от ее пропорции ко всей генеральной совокупности. Но исследователи должны убедиться, что слои не перекрываются. Каждая точка в популяции должна принадлежать только к одному слою, поэтому каждая точка является взаимоисключающей. Перекрывающиеся страты увеличили бы вероятность включения некоторых данных, таким образом исказив выборку.

Компания по производству сладостей может решить использовать метод случайной стратифицированной выборки, разделив своих 100 клиентов на разные возрастные группы, чтобы помочь сделать выводы о будущем ее производства.

Краткий обзор

Управляющие портфелем могут использовать стратифицированную случайную выборку для создания портфелей путем репликации индекса, такого как индекс облигаций.

Стратифицированная выборка имеет некоторые преимущества и недостатки по сравнению с простой случайной выборкой. Поскольку он использует определенные характеристики, он может обеспечить более точное представление совокупности на основе того, что используется для ее разделения на разные подмножества. Это часто требует меньшего размера выборки, что может сэкономить ресурсы и время. Кроме того, включив достаточное количество точек выборки из каждой страты, исследователи могут провести отдельный анализ для каждой отдельной страты.

Но для получения стратифицированной выборки требуется больше работы, чем для получения случайной выборки. Исследователи должны индивидуально отслеживать и проверять данные для каждой страты на предмет включения, что может занять намного больше времени по сравнению со случайной выборкой.