R-квадрат

Что такое R-квадрат?

R-квадрат (R 2 ) – это статистическая мера, которая представляет долю дисперсии для зависимой переменной, которая объясняется независимой переменной или переменными в регрессионной модели. В то время как корреляция объясняет силу взаимосвязи между независимой и зависимой переменной, R-квадрат объясняет, в какой степени дисперсия одной переменной объясняет дисперсию второй переменной. Таким образом, если R 2  модели равен 0,50, то примерно половина наблюдаемой вариации может быть объяснена входными данными модели.

При инвестировании R-квадрат обычно интерпретируется как процент движений фонда или ценных бумаг, которые можно объяснить движениями эталонного индекса. Например, R-квадрат для ценной бумаги с фиксированным доходом по сравнению с индексом облигаций определяет долю движения цены ценной бумаги, которая предсказуема на основе движения цены индекса. То же самое можно применить к акции по сравнению с индексом S&P 500 или любым другим соответствующим индексом.

Он также может быть известен как коэффициент детерминации .

Формула для R-квадрата Is

р2знак равно1-Unexplained VariationТотлВгятIоп \ begin {aligned} & \ text {R} ^ 2 = 1 – \ frac {\ text {Unexplained Variation}} {\ text {Total Variation}} \\ \ end {align}Взаимодействие с другими людьмир2знак равно1-Общая вариация

Ключевые моменты

  • R-Squared – это статистическая мера соответствия, которая показывает, насколько вариация зависимой переменной объясняется независимой (ыми) переменной (ами) в регрессионной модели.
  • При инвестировании R-квадрат обычно интерпретируется как процент движений фонда или ценных бумаг, которые можно объяснить движениями эталонного индекса.
  • R-квадрат 100% означает, что все движения ценной бумаги (или другой зависимой переменной) полностью объясняются движениями индекса (или интересующих вас независимых переменных).

Расчет R-квадрат

Фактический расчет R-квадрата требует нескольких шагов. Это включает в себя получение точек данных (наблюдений) зависимых и независимых переменных и поиск линии наилучшего соответствия , часто на основе регрессионной модели. Оттуда вы можете рассчитать прогнозируемые значения, вычесть фактические значения и возвести результаты в квадрат. Это дает список ошибок в квадрате, который затем суммируется и равен необъяснимой дисперсии.

Чтобы рассчитать общую дисперсию, вы должны вычесть среднее фактическое значение из каждого фактического значения, возвести результаты в квадрат и просуммировать их. Оттуда разделите первую сумму ошибок (объясненную дисперсию) на вторую сумму (общую дисперсию), вычтите результат из единицы, и вы получите R-квадрат. 

Что вам говорит R-Squared?

Значения R-квадрат находятся в диапазоне от 0 до 1 и обычно выражаются в процентах от 0% до 100%. R-квадрат 100% означает, что все движения ценной бумаги (или другой зависимой переменной) полностью объясняются движениями индекса (или интересующих вас независимых переменных).

При инвестировании высокий R-квадрат от 85% до 100% указывает на то, что доходность акций или фонда движется относительно в соответствии с индексом. Фонд с низким R-квадратом, равным 70% или меньше, указывает на то, что ценная бумага обычно не следует за движениями индекса. Более высокое значение R-квадрата укажет на более полезный показатель бета . Например, если у акции или фонда значение R-квадрата близко к 100%, но бета ниже 1, то они, скорее всего, предлагают более высокую доходность с поправкой на риск .

Разница между R-квадрат и скорректированный R-квадрат

R-Squared работает только по назначению в простой модели линейной регрессии с одной независимой переменной. При множественной регрессии, состоящей из нескольких независимых переменных, R-квадрат необходимо скорректировать. Скорректированный R-квадрат сравнивает описательную силу регрессионных моделей, которые включают различное количество предикторов. Каждый предиктор, добавленный к модели, увеличивает R-квадрат и никогда не уменьшает его. Таким образом, модель с большим количеством членов может показаться более подходящей только потому, что у нее больше членов, в то время как скорректированный R-квадрат компенсирует добавление переменных и увеличивается только в том случае, если новый член улучшает модель выше того, что было бы получается по вероятности и уменьшается, когда предсказатель улучшает модель меньше, чем предсказано случайно. В условиях  переобучения  получается неверно высокое значение R-квадрата, даже когда модель фактически имеет пониженную способность прогнозирования. Это не относится к скорректированному R-квадрату .

Разница между R-Squared и Beta

Бета и R-квадрат – это два связанных, но разных показателя корреляции, но бета – это показатель относительной рискованности. Паевой инвестиционный фонд с высоким R-квадратом сильно коррелирует с  эталоном . Если бета также высока, она может принести более высокую доходность, чем эталон, особенно на  бычьих рынках . R-квадрат измеряет, насколько близко каждое изменение цены актива коррелирует с эталоном. Бета измеряет, насколько велики эти изменения цен по сравнению с эталоном. Используемые вместе R-квадрат и бета дают инвесторам полную картину эффективности управляющих активами. Бета, равная точно 1,0, означает, что риск (волатильность) актива идентичен его эталонному показателю. По сути, R-квадрат – это метод статистического анализа для практического использования и надежности бета-версии ценных бумаг.

Ограничения R-Squared

R-квадрат даст вам оценку взаимосвязи между движениями зависимой переменной на основе движений независимой переменной. Он не говорит вам, хороша ли ваша выбранная модель или плоха, и не говорит вам, являются ли данные и прогнозы необъективными. Высокий или низкий R-квадрат не обязательно хорош или плох, поскольку он не передает надежность модели или правильность выбора регрессии. Вы можете получить низкий R-квадрат для хорошей модели или высокий R-квадрат для плохо подогнанной модели, и наоборот.

Часто задаваемые вопросы

Что такое хорошее значение R-квадрат

То, что считается «хорошим» значением R-Squared, будет зависеть от контекста. В некоторых областях, таких как социальные науки, даже относительно низкий R-Squared, такой как 0,5, можно считать относительно сильным. В других областях стандарты хорошего показания R-Squared могут быть намного выше, например 0,9 или выше. В сфере финансов R-Squared выше 0,7 обычно рассматривается как показывающий высокий уровень корреляции, тогда как показатель ниже 0,4 показывает низкую корреляцию. Однако это не жесткое правило, и оно будет зависеть от конкретного анализа.

Что означает значение R-Squared 0,9?

По сути, значение R-Squared, равное 0,9, означает, что 90% дисперсии изучаемой зависимой переменной объясняется дисперсией независимой переменной. Например, если у паевого инвестиционного фонда значение R-Squared составляет 0,9 относительно его эталонного показателя, это будет означать, что 90% дисперсии фонда объясняется дисперсией его эталонного индекса.

Лучше ли более высокий R-квадрат?

Здесь опять же, это зависит от контекста. Предположим, вы ищете индексный фонд, который будет максимально точно отслеживать конкретный индекс. В этом сценарии вы хотели бы, чтобы R-квадрат фонда был как можно более высоким, поскольку его цель – соответствовать, а не превышать индекс. С другой стороны, если вы ищете активно управляемые фонды , высокий R-Squared может рассматриваться как плохой знак, указывающий на то, что управляющие фондами не добавляют достаточной стоимости по сравнению со своими ориентирами.