Как можно рассчитать корреляцию с помощью Excel?

Что такое корреляция?

Корреляция измеряет линейную связь между двумя переменными. Измеряя и связывая дисперсию каждой переменной, корреляция дает представление о силе взаимосвязи.

Другими словами, корреляция отвечает на вопрос: насколько переменная A (независимая переменная) объясняет переменную B (зависимую переменную)?

Ключевые выводы

  • Корреляция — это статистическое линейное соответствие вариации между двумя переменными.
  • В финансах корреляция используется в нескольких аспектах анализа, включая расчет стандартного отклонения портфеля.
  • Вычисление корреляции может занять много времени, но такое программное обеспечение, как Excel, упрощает вычисление.

Понимание корреляции

Формула корреляции

Корреляция объединяет несколько важных и связанных статистических концепций, а именно дисперсию и стандартное отклонение. Дисперсия — это дисперсия переменной вокруг среднего значения, а стандартное отклонение — это квадратный корень из дисперсии.

Формула:

Поскольку корреляция хочет оценить линейную взаимосвязь двух переменных, то, что действительно требуется, — это увидеть, какую степень ковариации имеют эти две переменные и в какой степени эта ковариация отражается стандартными отклонениями каждой переменной в отдельности.

Распространенные ошибки с корреляцией

Самая распространенная ошибка — это предположение, что корреляция, приближающаяся к +/- 1, является статистически значимой. Показание, приближающееся к +/- 1, определенно увеличивает шансы на фактическую статистическую значимость, но без дальнейшего тестирования это невозможно узнать.

Статистическая проверка корреляции может усложняться по ряду причин; это совсем не просто. Важное предположение о корреляции состоит в том, что переменные независимы и что связь между ними линейна. Теоретически вы должны проверить эти утверждения, чтобы определить, подходит ли расчет корреляции.

Краткий обзор

Помните, что корреляция между двумя переменными НЕ означает, что A вызвало B или наоборот.

Вторая наиболее частая ошибка — это забвение нормализовать данные в единый блок. Если вычисляется корреляция для двух бета-версий, то единицы уже нормализованы: сама бета является единицей. Однако, если вы хотите соотнести акции, очень важно нормализовать их в процентах доходности, а не в изменении цены акций. Это случается слишком часто даже среди профессионалов в области инвестиций.

Что касается корреляции цен на акции, вы, по сути, задаете два вопроса: какова доходность за определенное количество периодов и как эта доходность соотносится с доходностью другой ценной бумаги за тот же период?

По этой же причине трудно установить корреляцию цен на акции: две ценные бумаги могут иметь высокую корреляцию, если доходность представляет собой ежедневные процентные изменения за последние 52 недели, но низкая корреляция, если доходность представляет собой ежемесячные изменения за последние 52 недели. Какой из них лучше»? На самом деле нет идеального ответа, и это зависит от цели теста.

Поиск корреляции в Excel

Существует несколько методов расчета корреляции в Excel. Самый простой — получить два набора данных бок о бок и использовать встроенную формулу корреляции:

Это удобный способ вычислить корреляцию между двумя наборами данных. Но что, если вы хотите создать корреляционную матрицу для ряда наборов данных? Для этого вам необходимо использовать плагин анализа данных Excel. Плагин можно найти на вкладке «Данные» в разделе «Анализ».

Выберите таблицу доходов. В этом случае наши столбцы имеют заголовки, поэтому мы хотим установить флажок «Ярлыки в первой строке», чтобы Excel обрабатывал их как заголовки. Затем вы можете выбрать вывод на том же листе или на новом листе.

Как только вы нажмете Enter, данные будут созданы автоматически. Вы можете добавить текст и условное форматирование, чтобы очистить результат.