Коефициент на корелация на Пиърсън (формула, пример) - Изчислете Pearson R

Определение на коефициента на корелация на Пиърсън

Коефициентът на корелация на Пиърсън, известен също като статистически тест на Pearson R, измерва силата между различните променливи и техните взаимоотношения. Когато се провежда статистически тест между двете променливи, винаги е добре човекът, който прави анализ, да изчисли стойността на коефициента на корелация, за да знае колко силна е връзката между двете променливи.

Коефициентът на корелация на Пиърсън връща стойност между -1 и 1. Тълкуването на коефициента на корелация е както при:

  • Ако коефициентът на корелация е -1, това показва силна отрицателна връзка. Това предполага перфектна отрицателна връзка между променливите.
  • Ако коефициентът на корелация е 0, това означава, че няма връзка.
  • Ако коефициентът на корелация е 1, това показва силна положителна връзка. Това предполага перфектна положителна връзка между променливите.

По-високата абсолютна стойност на коефициента на корелация показва по-силна връзка между променливите. По този начин, коефициент на корелация от 0,78 показва по-силна положителна корелация в сравнение със стойността от да кажем 0,36. По същия начин, коефициентът на корелация от -0,87 показва по-силна отрицателна корелация в сравнение с коефициента на корелация от да кажем -0,40.

С други думи, ако стойността е в положителен диапазон, това показва, че връзката между променливите е корелирана положително и двете стойности намаляват или се увеличават заедно. От друга страна, ако стойността е в отрицателен диапазон, това показва, че връзката между променливите е корелирана отрицателно и двете стойности ще отидат в обратната посока.

Формула за коефициент на корелация на Пиърсън

Формулата на коефициента на корелация на Пиърсън е както следва,

Където,

  • r = коефициент на Пиърсън
  • n = брой на двойките запаси
  • ∑xy = сума от продуктите на сдвоените запаси
  • ∑x = сума от х резултатите
  • ∑y = сума от y резултатите
  • ∑x 2 = сума от квадратите x точки
  • ∑y 2 = сума от квадратите на точки y

Обяснение

Стъпка 1: Разберете броя на двойките променливи, който е означен с n. Нека приемем, че x се състои от 3 променливи - 6, 8, 10. Нека приемем, че y се състои от съответните 3 променливи 12, 10, 20.

Стъпка 2: Избройте променливите в две колони.

Стъпка 3: Открийте произведението на x и y в третата колона.

Стъпка 4: Разберете сумата от стойностите на всички x променливи и всички y променливи. Напишете резултатите в долната част на 1- ва и 2- ра колона. Запишете сумата от x * y в третата колона.

Стъпка 5: Открийте x 2 и y 2 в 4 -та и 5 -та колона и тяхната сума в долната част на колоните.

Стъпка 6: Вмъкнете стойностите, намерени по-горе, във формулата и я разрешете.

r = 3 * 352-24 * 42 / √ (3 * 200-24 2 ) * (3 * 644-42 2 )

= 0,7559

Пример за коефициент на корелация на Пиърсън R

Пример 1

В този пример с помощта на следните подробности в таблицата на 6-те души с различна възраст и различни тегла, дадени по-долу за изчисляване на стойността на Pearson R

Sr No Възраст (x) Тегло (y)
1 40 78
2 21. 70
3 25 60
4 31 55
5 38 80
6 47 66

Решение:

За изчисляване на коефициента на корелация на Пиърсън първо ще изчислим следните стойности,

Тук общият брой на хората е 6, така че n = 6

Сега изчислението на Pearson R е както следва,

  • r = (n (∑xy) - (∑x) (∑y)) / (√ (n ∑x 2 - (∑x) 2 ) (n ∑y 2 - (∑y) 2 )
  • r = (6 * (13937) - (202) (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (6 * (13937) - (202) * (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (83622- 82618) / (√ (43680 -40804) * (170190- 167281)
  • r = 1004 / (√ (2876) * (2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892,452938
  • r = 0,35

По този начин стойността на коефициента на корелация на Пиърсън е 0,35

Пример # 2

Има 2 акции - А и Б. Цените на акциите им в определени дни са както следва:

Запас A (x) Stcok B (y)
45 9
50 8
53 8
58 7
60 5

Открийте коефициента на корелация на Пиърсън от горните данни.

Решение:

Първо ще изчислим следните стойности.

Изчисляването на коефициента на Пиърсън е както следва,

  • r = (5 * 1935-266 * 37) / ((5 * 14298- (266) 2) * (5 * 283- (37) 2)) 0,5
  • = -0,9088

Следователно коефициентът на корелация на Пиърсън между двата запаса е -0,9088.

Предимства

  • Помага да се разбере колко силна е връзката между двете променливи. Не само наличието или отсъствието на корелацията между двете променливи се посочва с помощта на коефициента на корелация на Пиърсън, но също така определя точната степен, до която тези променливи са свързани.
  • Използвайки този метод, може да се установи посоката на корелация, т.е. дали корелацията между две променливи е отрицателна или положителна.

Недостатъци

  • Коефициентът на корелация на Pearson R не е достатъчен, за да покаже разликата между зависимите променливи и независимите променливи, тъй като коефициентът на корелация между променливите е симетричен. Например, ако човек се опитва да знае връзката между високия стрес и кръвното налягане, тогава може да открие високата стойност на корелацията, което показва, че високият стрес причинява кръвното налягане. Сега, ако променливата е променена, резултатът в този случай също ще бъде същият, което показва, че стресът се причинява от кръвното налягане, което няма смисъл. По този начин изследователят трябва да е наясно с данните, които използва за провеждане на анализа.
  • Използвайки този метод, не може да се получи информация за наклона на линията, тъй като той само посочва дали съществува някаква връзка между двете променливи или не.
  • Вероятно коефициентът на корелация на Пиърсън може да бъде интерпретиран погрешно, особено в случай на еднородни данни.
  • В сравнение с другите методи на изчисление, този метод отнема много време, за да достигне до резултатите.

Важни точки

  • Стойностите могат да варират от стойността +1 до стойността -1, където +1 показва перфектната положителна връзка между разглежданите променливи, -1 показва перфектната отрицателна връзка между разглежданите променливи, а стойност 0 показва, че няма връзка съществува между разглежданите променливи.
  • Той е независим от мерната единица на променливите. Например, ако мерната единица на една променлива е в години, докато мерната единица на втората променлива е в килограми, дори тогава, стойността на този коефициент не се променя.
  • Коефициентът на корелация между променливите е симетричен, което означава, че стойността на коефициента на корелация между Y и X или X и Y ще остане същата.

Заключение

Коефициентът на корелация на Пиърсън е видът на коефициент на корелация, който представлява връзката между двете променливи, които се измерват на един и същ интервал или същата скала на съотношението. Той измерва силата на връзката между двете непрекъснати променливи.

Той не само посочва наличието или отсъствието на корелацията между двете променливи, но също така определя точната степен, до която тези променливи са свързани. Той е независим от мерната единица на променливите, където стойностите на коефициента на корелация могат да варират от стойността +1 до стойността -1. Не е достатъчно обаче да се каже разликата между зависимите променливи и независимите променливи.

Интересни статии...