P-значение

Что такое P-значение?

В статистике p-значение – это вероятность получения результатов, по крайней мере, столь же экстремальных, как наблюдаемые результаты проверки статистической  гипотезы , при условии, что нулевая гипотеза верна. Значение p используется как альтернатива точкам отклонения, чтобы обеспечить наименьший уровень значимости, при котором  нулевая гипотеза будет отклонена. Меньшее значение p означает, что есть более веские доказательства в пользу альтернативной гипотезы.

Ключевые моменты

  • Значение p – это мера вероятности того, что наблюдаемое различие могло произойти случайно.
  • Чем ниже p-значение, тем выше статистическая значимость наблюдаемой разницы.
  • P-значение может использоваться в качестве альтернативы или в дополнение к заранее выбранным уровням достоверности для проверки гипотез.

Как рассчитывается P-Value?

P-значения обычно находятся с помощью таблиц p-значений или электронных таблиц / статистического программного обеспечения. Эти расчеты основаны на предполагаемом или известном распределении вероятностей конкретной проверяемой статистики. P-значения рассчитываются из отклонения между наблюдаемым значением и выбранным эталонным значением, учитывая распределение вероятностей статистики, с большей разницей между двумя значениями, соответствующими более низкому p-значению.

Математически p-значение рассчитывается с использованием интегрального исчисления из площади под кривой распределения вероятностей для всех статистических значений, которые по крайней мере так же далеки от эталонного значения, как и наблюдаемое значение, относительно общей площади под кривой распределения вероятностей. . Вкратце, чем больше разница между двумя наблюдаемыми значениями, тем меньше вероятность того, что разница вызвана простой случайной случайностью, и это отражается более низким значением p.

Подход P-Value к проверке гипотез

Подход с p-значением к проверке гипотез использует вычисленную вероятность, чтобы определить, есть ли свидетельства для отклонения нулевой гипотезы. Нулевая гипотеза, также известная как гипотеза, является первоначальным утверждением о популяции (или процессе генерации данных). Альтернативная гипотеза утверждает, отличается ли параметр населения от значения параметра населения, указанного в гипотезе.

На практике уровень значимости указывается заранее, чтобы определить, насколько малым должно быть значение p, чтобы отвергнуть нулевую гипотезу. Поскольку разные исследователи используют разные уровни значимости при изучении вопроса, читателю иногда может быть сложно сравнить результаты двух разных тестов. P-значения обеспечивают решение этой проблемы.

Например, предположим, что исследование, сравнивающее доходность двух конкретных активов, было проведено разными исследователями, которые использовали одни и те же данные, но с разными уровнями значимости. Исследователи могут прийти к противоположным выводам относительно того, различаются ли активы. Если один исследователь использовал уровень достоверности 90%, а другому требовался уровень достоверности 95%, чтобы отклонить нулевую гипотезу, а p-значение наблюдаемой разницы между двумя результатами было 0,08 (соответствует уровню достоверности 92%) , то первый исследователь обнаружит, что два актива имеют статистически значимое различие, а второй не обнаружит статистически значимой разницы между доходами.

Чтобы избежать этой проблемы, исследователи могут сообщить p-значение теста гипотезы и позволить читателю самостоятельно интерпретировать  статистическую значимость  . Такой подход к проверке гипотез называется p-value. Независимый наблюдатель может отметить значение p и решить для себя, представляет ли оно статистически значимое различие или нет.

Реальный пример P-Value

Предположим, инвестор утверждает, что эффективность его инвестиционного портфеля эквивалентна показателям индекса Standard & Poor’s (S&P) 500. Чтобы определить это, инвестор проводит двусторонний тест. Нулевая гипотеза утверждает, что доходность портфеля эквивалентна доходности S&P 500 за указанный период, в то время как альтернативная гипотеза утверждает, что доходность портфеля и доходность S&P 500 не эквивалентны. (Если инвестор провел односторонний тест, альтернативная гипотеза будет утверждать, что доходность портфеля либо меньше, либо больше доходности S&P 500.)

Проверка гипотезы P-значения не обязательно использует заранее выбранный уровень достоверности, при котором инвестор должен сбросить нулевую гипотезу об эквивалентности доходов. Вместо этого он дает меру того, сколько существует доказательств для отклонения нулевой гипотезы. Чем меньше p-значение, тем больше доказательств против нулевой гипотезы. Таким образом, если инвестор обнаруживает, что значение p равно 0,001, есть веские доказательства против нулевой гипотезы, и инвестор может уверенно заключить, что доходность портфеля и доходность S&P 500 не эквивалентны.

Хотя это не дает точного порога, когда инвестор должен принять или отвергнуть нулевую гипотезу, у него есть еще одно очень практическое преимущество. Проверка гипотезы P-значения предлагает прямой способ сравнить относительную уверенность, которую может иметь инвестор при выборе между несколькими различными типами инвестиций или портфелей, по сравнению с эталоном, таким как S&P 500.

Например, для двух портфелей, A и B, показатели которых отличаются от показателей S&P 500 с p-значениями 0,10 и 0,01 соответственно, инвестор может быть гораздо более уверен в том, что портфель B с более низким p-значением на самом деле будет показывать последовательно разные полученные результаты.