Простая случайная выборка

Что такое Простая случайная выборка?

Простая случайная выборка – это подмножество статистической совокупности, в которой каждый член подмножества имеет равную вероятность быть выбранным. Простая случайная выборка предназначена для беспристрастного представления группы.

Примером простой случайной выборки могут быть имена 25 сотрудников, выбранных на пустом месте из компании с 250 сотрудниками. В этом случае совокупность состоит из 250 сотрудников, и выборка является случайной, потому что у каждого сотрудника есть равные шансы быть выбранным. Случайная выборка используется в науке для проведения рандомизированных контрольных тестов или слепых экспериментов.

Краткая справка

Нет более простого метода извлечения исследовательской выборки из более широкой совокупности, чем простая случайная выборка. Полностью случайный выбор субъектов из большей совокупности также дает выборку, которая является репрезентативной для изучаемой группы.

Понимание простой случайной выборки

Исследователи могут создать простую случайную выборку, используя несколько методов. При использовании метода лотереи каждому члену населения присваивается номер, после чего номера выбираются случайным образом.

Пример, в котором имена 25 сотрудников из 250 выбраны совершенно неожиданно, является примером действующего метода лотереи. Каждому из 250 сотрудников будет присвоен номер от 1 до 250, после чего 25 из этих номеров будут выбраны случайным образом.

Поскольку люди, составляющие подмножество большей группы, выбираются случайным образом, каждый человек в большой группе населения имеет одинаковую вероятность быть выбранным. В большинстве случаев это создает сбалансированное подмножество, несущее наибольший потенциал для представления большей группы в целом, без каких-либо предубеждений.

Для больших групп населения ручной метод лотереи может быть довольно обременительным. Для выбора случайной выборки из большой совокупности обычно требуется компьютерный процесс, в котором используется та же методология, что и в методе лотереи, только присвоение номеров и последующий выбор выполняется компьютерами, а не людьми.

Место для ошибок

В простой случайной выборке должно быть место для ошибки, представленной плюсовой и минусовой  дисперсией ( ошибка выборки ). Например, если в средней школе из 1000 учеников нужно было провести опрос, чтобы определить, сколько учеников левши, случайная выборка может определить, что восемь из 100 отобранных – левши. Можно сделать вывод, что 8% учащихся средней школы – левши, тогда как на самом деле средний мировой показатель был бы ближе к 10%.

То же самое верно независимо от предмета. Обследование процентной доли студентов с зелеными глазами или физически недееспособных привело бы к математической вероятности, основанной на простом случайном опросе, но всегда с плюсовой или минусовой дисперсией. Единственный способ добиться 100% точности – это опрос всех 1000 студентов, что, хотя и возможно, было бы непрактично.

Ключевые моменты

  • Простая случайная выборка берет небольшую случайную часть всей генеральной совокупности для представления всего набора данных, где каждый член имеет равную вероятность быть выбранным.
  • Исследователи могут создать простую случайную выборку, используя такие методы, как лотереи или случайные розыгрыши.
  • Ошибка выборки может произойти с простой случайной выборкой, если в конечном итоге выборка не точно отражает совокупность, которую она должна представлять.

Сравнение простой случайной и стратифицированной случайной выборки

Простые случайные выборки и стратифицированные случайные выборки являются инструментами статистических измерений . Простая случайная выборка используется для представления всей совокупности данных. Стратифицированная случайная выборка делит население на более мелкие группы или страты на основе общих характеристик.

В отличие от простых случайных выборок, стратифицированные случайные выборки используются с популяциями, которые можно легко разбить на различные подгруппы или подмножества. Эти группы основаны на определенных критериях, затем элементы из каждой случайным образом выбираются пропорционально размеру группы по сравнению с населением.

Этот метод выборки означает, что будет выборка из каждой отдельной группы, размер которой зависит от ее пропорции ко всей генеральной совокупности. Но исследователи должны убедиться, что слои не перекрываются. Каждая точка в популяции должна принадлежать только к одному слою, поэтому каждая точка является  взаимоисключающей . Перекрывающиеся страты увеличивают вероятность включения некоторых данных, таким образом искажая выборку.

Преимущества простых случайных выборок

Простота использования представляет собой самое большое преимущество простой случайной выборки . В отличие от более сложных методов выборки, таких как стратифицированная случайная выборка и вероятностная выборка, нет необходимости делить генеральную совокупность на подгруппы или предпринимать какие-либо другие дополнительные шаги перед случайным выбором членов совокупности.

Простая случайная выборка предназначена для беспристрастного представления группы. Это считается справедливым способом выбора выборки из более широкой совокупности, поскольку каждый член совокупности имеет равные шансы быть выбранным.

Краткая справка

Хотя простая случайная выборка призвана быть объективным подходом к обследованию, может возникнуть систематическая ошибка отбора выборки. Когда набор выборки большей совокупности недостаточно инклюзивен, представление всей совокупности искажается и требует дополнительных методов выборки.

Недостатки простых случайных выборок

Ошибка выборки может произойти с простой случайной выборкой, если в конечном итоге выборка не точно отражает совокупность, которую она должна представлять. Например, в нашей простой случайной выборке из 25 сотрудников можно было бы выбрать 25 мужчин, даже если бы население состояло из 125 женщин и 125 мужчин.

По этой причине простая случайная выборка чаще используется, когда исследователь мало знает о совокупности. Если бы исследователь знал больше, было бы лучше использовать другую технику выборки, например стратифицированную случайную выборку , которая помогает учесть различия внутри населения, такие как возраст, раса или пол. К другим недостаткам можно отнести тот факт, что для отбора проб из больших популяций этот процесс может быть трудоемким и дорогостоящим по сравнению с другими методами.