Эмпирическое правило

Что такое Эмпирическое правило?

Эмпирическое правило, также называемое правилом трех сигм или правилом 68-95-99.7, представляет собой статистическое правило, которое гласит, что для нормального распределения почти все наблюдаемые данные будут находиться в пределах трех стандартных отклонений (обозначаемых σ) от среднее или среднее (обозначается µ).

В частности, эмпирическое правило предсказывает, что 68% наблюдений попадают в пределы первого стандартного отклонения (µ ± σ), 95% – в пределах первых двух стандартных отклонений (µ ± 2σ) и 99,7% – в пределах первых трех стандартных отклонений (µ ± 3σ).

Ключевые моменты

  • Эмпирическое правило гласит, что 99,7% данных, наблюдаемых при нормальном распределении, находятся в пределах 3 стандартных отклонений от среднего.
  • Согласно этому правилу, 68% данных попадают в пределы одного стандартного отклонения, 95% процентов – в пределах двух стандартных отклонений и 99,7% – в пределах трех стандартных отклонений от среднего.
  • Пределы трех сигм, которые следуют эмпирическому правилу, используются для установки верхнего и нижнего контрольных пределов в диаграммах статистического контроля качества и в анализе риска, таком как VaR.

Понимание эмпирического правила

Эмпирическое правило часто используется в статистике для прогнозирования конечных результатов. После вычисления стандартного отклонения и перед сбором точных данных это правило можно использовать в качестве приблизительной оценки результатов предстоящих данных, которые будут собраны и проанализированы.

Таким образом, это распределение вероятностей можно использовать в качестве промежуточной эвристики, поскольку сбор соответствующих данных может потребовать много времени или даже в некоторых случаях невозможен. Такие соображения вступают в игру, когда фирма пересматривает свои меры контроля качества или оценивает свою подверженность рискам. Например, широко используемый инструмент риска, известный как стоимость под риском (VaR), предполагает, что вероятность событий риска следует нормальному распределению.

Эмпирическое правило также используется как приблизительный способ проверки «нормальности» распределения. Если слишком много точек данных выходит за пределы трех границ стандартного отклонения, это говорит о том, что распределение не является нормальным и вместо этого может быть искажено или следовать некоторому другому распределению.

Эмпирические правила также известны как правило трех сигм, поскольку «три сигма» относятся к статистическому распределению данных в пределах трех стандартных отклонений от среднего при нормальном распределении ( колоколообразная кривая ), как показано на рисунке ниже.

Примеры эмпирического правила

Предположим, что популяция животных в зоопарке нормально распределена . Каждое животное живет в среднем до 13,1 года (в среднем), а стандартное отклонение продолжительности жизни составляет 1,5 года. Если кто-то хочет узнать вероятность того, что животное проживет дольше 14,6 лет, он может использовать эмпирическое правило. Зная, что среднее значение распределения составляет 13,1 года, для каждого стандартного отклонения встречаются следующие возрастные диапазоны:

  • Одно стандартное отклонение (µ ± σ): от (13,1–1,5) до (13,1 + 1,5) или от 11,6 до 14,6
  • Два стандартных отклонения (µ ± 2σ): от 13,1 – (2 x 1,5) до 13,1 + (2 x 1,5) или от 10,1 до 16,1
  • Три стандартных отклонения (µ ± 3σ): от 13,1 – (3 x 1,5) до 13,1 + (3 x 1,5), или от 8,6 до 17,6

Человек, решающий эту задачу, должен рассчитать общую вероятность того, что животное проживет 14,6 лет или дольше. Эмпирическое правило показывает, что 68% распределения находится в пределах одного стандартного отклонения, в данном случае от 11,6 до 14,6 лет. Таким образом, оставшиеся 32% распределения лежат за пределами этого диапазона. Половина находится выше 14,6, а половина – ниже 11,6. Таким образом, вероятность того, что животное проживет более 14,6 лет, составляет 16% (рассчитывается как 32%, разделенные на два).

В качестве другого примера предположим, что животное в зоопарке доживает в среднем до 10 лет со стандартным отклонением 1,4 года. Предположим, смотритель зоопарка пытается выяснить вероятность того, что животное проживет более 7,2 лет. Это распределение выглядит следующим образом:

  • Одно стандартное отклонение (µ ± σ): от 8,6 до 11,4 года
  • Два стандартных отклонения (µ ± 2σ): от 7,2 до 12,8 лет
  • Три стандартных отклонения ((µ ± 3σ): от 5,8 до 14,2 года

Эмпирическое правило гласит, что 95% распределения находится в пределах двух стандартных отклонений. Таким образом, 5% находится за пределами двух стандартных отклонений; половина старше 12,8 лет и половина ниже 7,2 года. Таким образом, вероятность прожить более 7,2 лет составляет:

95% + (5% / 2) = 97,5%