Формула на корелация - Как да изчислим? (Стъпка по стъпка)

Формула за изчисляване на корелацията

Корелацията е статистическа мярка между две променливи и се определя като промяна на количеството в една променлива, съответстваща на промяна в друга и се изчислява чрез сумиране на произведението от сумата на първата променлива минус средната стойност на първата променлива в сумата на втората променлива минус средната стойност на втората променлива, разделена на цяла под корен на произведението на квадрат от първата променлива минус средната стойност на първата променлива на сума от квадрат на втората променлива минус средната стойност на втората променлива

Стойността на корелацията е ограничена между -1 и +1 и може да се интерпретира по следния начин:

  • -1: Ако е -1, тогава променливите са известни като напълно отрицателно корелирани. Това означава, че ако една променлива се движи в една посока, тогава друга се движи в обратна посока.
  • 0: Това означава, че променливата няма никаква корелация.
  • +1: Ако е +1, тогава променливите са известни като напълно положително корелирани. И двете променливи се движат в положителни посоки.

Ако имаме 2 променливи x и y, тогава коефициентът на корелация между 2 променливи може да бъде намерен като:

Коефициент на корелация = ∑ (x (i) - средно (x)) * (y (i) -означава (y)) / √ (∑ (x (i) -означава (x)) 2 * ∑ (y (i) -означава (y)) 2 )

Където,

  • x (i) = стойност на x в пробата
  • Средна стойност (x) = средна стойност на всички стойности на x
  • y (i) = стойност на y в пробата
  • Средна стойност (y) = средна стойност на всички стойности на y

Примери

Лесно е да се изчисли корелацията в Excel. Синтаксисът на използваната функция е както следва:

Коефициент на корелация = CORREL (масив1, масив2)

Пример # 1

Нека вземем същия пример, който взехме по-горе за изчисляване на корелацията с помощта на Excel.

Решение:

По-долу са стойностите на x и y:

Изчислението е както следва.

Основна формула на Excel = CORREL (масив (x), масив (y))

Коефициент = +0,95

Тъй като този коефициент е близо до +1, следователно x и y са силно положително свързани.

Пример # 2

Корелацията е полезна главно за анализ на цената на акциите на компаниите и създаване на портфейл от акции въз основа на това.

Нека да разберем корелацията на акциите на Apple с индекса Nasdaq въз основа на последната едногодишна ефективност на акциите. Apple е базирана в САЩ мултинационална компания, специализирана в ИТ продукти като iPod, iPad, Mac и др.

Решение:

По-долу е месечната възвръщаемост на акциите на Apple и Nasdaq за последната една година:

Нека сега въведем стойностите -

Коефициент на корелация = ∑ (x (i) - означава (x)). (Y (i) -означава (y)) / √ ∑ (x (i) -означава (x)) 2 ∑ (y (i) - означава (y)) 2

Корелация между Apple и Nasdaq = 0,039 / (.000,0039)

Коефициент = 0,62

Тъй като корелацията между Apple и Nasdaq е положителна, следователно Apple положително корелира с Nasdaq.

Пример # 3

Нека сега разгледаме корелацията между индекса на Walmart и Nasdaq въз основа на последното едногодишно представяне на акциите. Walmart е американска компания, която има верига супермаркети на дребно.

Решение:

По-долу е месечното представяне между Walmart и Nasdaq за последната една година-

Нека сега въведем стойностите във формулата -

Коефициент на корелация = ∑ (x (i) - означава (x)). (Y (i) -означава (y)) / √ ∑ (x (i) -означава (x)) 2 ∑ (y (i) - означава (y)) 2

Следователно изчислението е както следва,

Корелация между Walmart и Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Коефициент = 0,12

Виждаме, че Walmart и Nasdaq също имат положителна корелация, но не толкова в сравнение с Apple корелация с Nasdaq.

Уместност и употреба

Коефициентът на корелация е полезен при установяване на линейната връзка между две променливи. Той измерва как ще се движи променлива в сравнение с движението на друга променлива. Практическото използване на този коефициент е да се установи връзката между движението на цените на акциите и общото движение на пазара. Основата на този анализ, анализатор на акции, ще включва дела на акциите, за да се създаде оптимален портфейл с минимален риск. Също така е полезно в науката за данни да се установи връзката между 2 променливи.

Също така коефициентът на корелация се използва много силно за изследване на конструктивната валидност на данните при факторния анализ. Той се използва силно в регресионния анализ за прогнозиране на стойностите на зависими променливи въз основа на връзката между зависими и независими променливи. Това уравнение е доста полезно при количествен анализ, за ​​да се получи естеството на връзката между различни променливи. В основата на тази връзка, ако дадена променлива не е свързана с други променливи, тя може да бъде премахната от списъка.

Интересни статии...