Выборочное распределение

Что такое Выборочное распределение?

Распределение выборки – это распределение вероятностей статистики, полученной из большего числа выборок, взятых из определенной совокупности. Распределение выборки данной популяции – это распределение частот ряда различных исходов, которые могли бы иметь место для статистики данной популяции .

В  статистике совокупность – это весь пул, из которого  берется статистическая  выборка . Популяция может относиться ко всей группе людей, объектов, событий, посещений больниц или измерений. Таким образом, можно сказать, что совокупность – это совокупное наблюдение за субъектами, сгруппированными по общему признаку.

Краткая справка

  • Распределение выборки – это статистика, полученная путем повторной выборки из более широкой совокупности.
  • Он описывает диапазон возможных результатов статистики, таких как среднее значение или мода некоторой переменной, поскольку на самом деле существует совокупность.
  • Большинство данных, анализируемых исследователями, фактически взяты из выборок, а не из популяций.

Понимание распределения выборки

Многие данные, собранные и используемые академиками, статистиками, исследователями, маркетологами, аналитиками и т. Д., На самом деле являются выборками, а не совокупностями. Выборка – это подмножество населения. Например, медицинский исследователь, который хотел сравнить средний вес всех детей, родившихся в Северной Америке с 1995 по 2005 год, с теми, кто родился в Южной Америке в течение того же периода времени, не может в разумные сроки получить данные для всего населения более миллиона родов, произошедших за десятилетний период. Вместо этого он будет использовать вес, скажем, 100 младенцев на каждом континенте, чтобы сделать вывод. В качестве выборки использовался вес 200 младенцев, а рассчитанный средний вес – это среднее значение выборки.

Теперь предположим, что вместо того, чтобы брать только одну выборку из 100 новорожденных с массой тела с каждого континента, медицинский исследователь берет повторяющиеся случайные выборки из общей популяции и вычисляет среднее значение выборки для каждой группы выборки. Итак, для Северной Америки он извлекает данные о 100 весах новорожденных, зарегистрированных в США, Канаде и Мексике, следующим образом: четыре 100 образца из избранных больниц США, пять 70 образцов из Канады и три 150 записей из Мексики, в сумме 1200 гирь новорожденных, сгруппированных в 12 наборов. Он также собирает выборочные данные о 100 весах при рождении из каждой из 12 стран Южной Америки.

Краткая справка

Каждая выборка имеет собственное выборочное среднее, и распределение выборочных средних известно как выборочное распределение.

Средний вес, вычисленный для каждого набора выборок, представляет собой выборочное распределение среднего. По выборке можно рассчитать не только среднее значение. Другие статистические данные , такие как стандартное отклонение, дисперсия, пропорция и диапазон, могут быть рассчитаны на основе данных выборки. Стандартное отклонение и дисперсия измеряют изменчивость распределения выборки.

Количество наблюдений в генеральной совокупности, количество наблюдений в выборке и процедура, используемая для построения выборок, определяют изменчивость выборочного распределения. Стандартное отклонение выборочного распределения называется стандартной ошибкой . В то время как среднее значение выборочного распределения равно среднему значению генеральной совокупности, стандартная ошибка зависит от стандартного отклонения генеральной совокупности, размера совокупности и размера выборки.

Знание того, насколько различаются средние значения каждого из наборов выборок друг от друга и от среднего значения генеральной совокупности, даст представление о том, насколько близко среднее значение выборки к среднему значению совокупности. Стандартная ошибка распределения выборки уменьшается с увеличением размера выборки.

Особые соображения

Население или один набор чисел будет иметь нормальное распределение. Однако, поскольку распределение выборки включает несколько наборов наблюдений, оно не обязательно будет иметь форму колокола .

Следуя нашему примеру, средний вес детей в популяции в Северной Америке и Южной Америке имеет нормальное распределение, потому что некоторые дети будут иметь недостаточный вес (ниже среднего) или избыточный (выше среднего), при этом большинство младенцев попадают в промежуточное положение (около среднего). ). Если средний вес новорожденных в Северной Америке составляет семь фунтов, средний вес выборки в каждом из 12 наборов выборочных наблюдений, зарегистрированных для Северной Америки, также будет близок к семи фунтам.

Однако если вы построите график каждого из средних значений, рассчитанных в каждой из 1200 групп выборок, полученная форма может привести к равномерному распределению, но трудно с уверенностью предсказать, какой окажется фактическая форма. Чем больше выборок использует исследователь из населения, насчитывающего более миллиона весовых фигур, тем больше график начнет формировать нормальное распределение.