Quintiles

Что такое Quintiles?

Квинтиль – это статистическое значение набора данных, представляющего 20% данной совокупности, поэтому первый квинтиль представляет собой пятую часть самого низкого значения (от 1% до 20%); второй квинтиль представляет собой второй пятый (от 21% до 40%) и так далее.

Квинтили используются для создания пороговых значений для данной популяции; социально-экономическое исследование, спонсируемое государством, может использовать квинтили для определения максимального благосостояния, которым может обладать семья, чтобы принадлежать к самому низкому квинтилю общества. Затем этот предел может быть использован в качестве предварительного условия для получения семьей специальной государственной субсидии, направленной на помощь менее удачливым слоям общества.

Ключевые моменты

  • Квинтили представляют 20% данной популяции. Таким образом, первый квинтиль представляет собой пятую часть самого низкого уровня данных, а последний квинтиль представляет собой последнюю или последнюю пятую часть данных.
  • Они обычно используются для больших наборов данных и часто используются политиками и экономистами для обсуждения концепций экономической и социальной справедливости.
  • В зависимости от размера совокупности альтернативы квинтилям включают квартили и тертили.

Понимание квинтилей

Квинтиль – это тип квантиля, который определяется как равные по размеру сегменты населения. Один из наиболее распространенных показателей в статистическом анализе, медиана, на самом деле является просто результатом деления совокупности на два квантиля. Квинтиль – это одно из пяти значений, которые делят диапазон данных на пять равных частей, каждая из которых составляет 1/5 (20 процентов) диапазона. Население, разделенное на три равные части, делится на тертили, а население, разделенное на четверти, делится на квартили . Чем больше набор данных, тем легче его разделить на большие квантили. Экономисты часто используют квинтили для анализа очень больших наборов данных, таких как население Соединенных Штатов.

Например, если бы мы смотрели на все цены закрытия для конкретной акции каждый день в прошлом году, верхние 20% этих цен представляли бы верхний квинтиль данных. Нижние 20% этих цен будут представлять нижний квинтиль данных. Между верхним и нижним квинтилями будет три квинтиля. В то время как среднее значение всех цен акций обычно находится между вторым и четвертым квинтилями, которые являются средней точкой данных, выбросы на верхнем или нижнем уровне данных могут увеличивать или уменьшать среднее значение. В результате, при попытке понять данные и средние значения стоит учитывать распределение точек данных и учитывать любые существенные выбросы.

Распространенное использование квинтилей

Политики используют квинтили, чтобы проиллюстрировать необходимость изменений в политике. Например, политик, отстаивающий экономическую справедливость, может разделить население на квинтили, чтобы проиллюстрировать, как 20% самых богатых людей контролируют то, что, по его мнению, является несправедливо большой долей богатства. На другом конце спектра политик, призывающий к прекращению прогрессивного налогообложения, может использовать квинтили, чтобы аргументировать, что верхние 20% несут слишком большую долю налогового бремени.

В «The Bell Curve», противоречивой книге 1994 года о коэффициенте интеллекта (IQ), авторы используют квинтили по всему тексту, чтобы проиллюстрировать свое исследование, показывая, что IQ сильно коррелирует с положительными результатами в жизни.

Альтернативы Quintiles

Для определенных групп населения использование других методов для изучения распределения данных имеет больше смысла, чем использование квинтилей. Для небольших наборов данных использование квартилей или тертилей помогает предотвратить слишком тонкое распределение данных. Сравнение среднего или среднего значения набора данных с его медианой или точкой отсечения, где данные делятся на два квантиля, показывает, равномерно ли распределены данные или смещены ли они вверх или вниз. Среднее значение, которое значительно выше медианы, указывает на то, что данные занимают первое место, в то время как более низкое среднее значение говорит об обратном.