Квартиль

Что такое Квартиль?

Квартиль — это статистический термин, который описывает разделение наблюдений на четыре определенных интервала на основе значений данных и их сравнения со всем набором наблюдений.

Общие сведения о квартилях

Чтобы понять квартиль, важно понимать  медианное значение  как  меру центральной тенденции . Медиана в статистике — это среднее значение набора чисел. Это точка, в которой ровно половина данных находится ниже и выше центрального значения.

Итак, учитывая набор из 13 чисел, медиана будет седьмым числом. Шесть чисел, предшествующих этому значению, являются наименьшими числами в данных, а шесть чисел после медианы — наибольшими числами в данном наборе данных. Поскольку на медианное значение не влияют экстремальные значения или выбросы в распределении, иногда оно предпочтительнее  среднего .

Медиана является надежным средством оценки местоположения, но ничего не говорит о том, как данные по обе стороны от ее значения распространяются или рассредоточены. Вот где вступает в игру квартиль. Квартиль измеряет разброс значений выше и ниже среднего путем деления распределения на четыре группы.

Ключевые моменты

  • Квартиль измеряет разброс значений выше и ниже среднего путем разделения распределения на четыре группы.
  • Квартиль делит данные на три точки — нижний квартиль, медиана и верхний квартиль — для формирования четырех групп набора данных.
  • Квартили используются для расчета межквартильного размаха, который является мерой изменчивости вокруг медианы.

Как работают квартили

Точно так же, как медиана делит данные пополам, так что 50% измерения лежит ниже медианы, а 50% — выше нее, квартиль разбивает данные на кварталы, так что 25% измерений меньше нижнего квартиля, 50 % меньше среднего, а 75% меньше верхнего квартиля.

Квартиль делит данные на три точки — нижний квартиль, медиана и верхний квартиль — для формирования четырех групп набора данных. Нижний квартиль или первый квартиль обозначается как Q1 и является средним числом, которое находится между наименьшим значением набора данных и медианой. Второй квартиль, Q2, также является медианным. Верхний или третий квартиль, обозначаемый Q3, является центральной точкой, которая находится между медианой и наивысшим номером распределения.

Теперь мы можем выделить четыре группы, сформированные из квартилей. Первая группа значений содержит наименьшее число до Q1; во вторую группу входит Q1 до медианы; третий набор — это медиана Q3; четвертая категория включает Q3 в самую высокую точку данных всего набора.

Каждый квартиль содержит 25% от общего числа наблюдений. Как правило, данные располагаются от наименьшего к наибольшему:

  1. Первый квартиль: самые низкие 25% чисел
  2. Второй квартиль: от 25,1% до 50% (до медианы)
  3. Третий квартиль: от 51% до 75% (выше медианы)
  4. Четвертый квартиль: самые высокие 25% чисел

Пример квартиля

Предположим, что баллы по математике в классе из 19 учеников в порядке возрастания распределены следующим образом:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Сначала отметьте медианное значение Q2, которое в данном случае является 10- м значением: 75.

Q1 — это центральная точка между наименьшей оценкой и медианой. В этом случае Q1 попадает между первым и пятым баллом: 68. [Обратите внимание, что медиана также может быть включена при вычислении Q1 или Q3 для нечетного набора значений. Если бы мы включили медианное значение по обе стороны от средней точки, то Q1 будет средним значением между первым и 10- м баллами, что является средним значением пятого и шестого баллов — (пятый + шестой) / 2 = ( 68 + 69) / 2 = 68,5].

Q3 — это среднее значение между Q2 и наивысшим баллом: 84. [Или, если вы включаете медиану, Q3 = (82 + 84) / 2 = 83].

Теперь, когда у нас есть квартили, давайте интерпретируем их числа. Оценка 68 (Q1) представляет первый квартиль и 25- й  процентиль. 68 — это медиана нижней половины оценки, установленной в имеющихся данных, то есть медиана оценок от 59 до 75.

Q1 говорит нам, что 25% оценок ниже 68 и 75% оценок класса выше. Q2 (медиана) — это 50- й  процентиль и показывает, что 50% оценок меньше 75, а 50% оценок выше 75. Наконец, Q3, 75- й процентиль, показывает, что 25% оценок являются больше и 75% меньше 84.

Особые соображения

Если точка данных для Q1 дальше от медианы, чем Q3 от медианы, то мы можем сказать, что существует больший разброс среди меньших значений набора данных, чем среди больших значений. Та же самая логика применяется, если Q3 дальше от Q2, чем Q1 от медианы.

В качестве альтернативы, если имеется четное количество точек данных, медиана будет средним из двух средних чисел. В нашем примере выше, если бы у нас было 20 студентов вместо 19, медиана их оценок будет  средним арифметическим  10- го и 11- го числа.

Квартили используются для расчета межквартильного размаха, который является мерой изменчивости вокруг медианы. Межквартильный размах просто рассчитывается как разница между первым и третьим квартилями: Q3 – Q1. Фактически, это диапазон средней половины данных, который показывает, насколько разбросаны данные.

Для больших наборов данных в Microsoft Excel есть функция КВАРТИЛЬ для вычисления квартилей.