R на квадрат (R ^ 2) - дефиниция, формула, изчислете R на квадрат

Какво е R на квадрат (R2) в регресия?

R-квадрат (R 2 ) е важна статистическа мярка, която е регресионен модел, който представлява делът на разликата или отклонението в статистически термини за зависима променлива, която може да бъде обяснена с независима променлива или променливи. Накратко, това определя доколко данните ще отговарят на модела на регресия.

R Формула на квадрат

За изчисляването на R на квадрат трябва да определите коефициента на корелация и след това трябва да квадратирате резултата.

R Формула на квадрат = r 2

Където r коефициентът на корелация може да бъде изчислен по-долу:

r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))

Където,

  • r = Коефициентът на корелация
  • n = число в дадения набор от данни
  • x = първа променлива в контекста
  • y = втора променлива

Обяснение

Ако има някаква връзка или корелация, която може да бъде линейна или нелинейна между тези две променливи, тогава тя указва дали има промяна в независимата променлива в стойността, тогава другата зависима променлива вероятно ще се промени в стойността, да речем линейно или нелинейно.

Числителната част на формулата провежда тест дали се движат заедно и премахва индивидуалните им движения и относителната сила и на двамата, които се движат заедно, а знаменателната част на формулата скалира числителя, като взема квадратния корен от произведението на разликите на променливите от техните квадратни променливи. И когато на квадрат получите този резултат, получаваме R на квадрат, което не е нищо друго освен коефициент на определяне.

Примери

Пример # 1

Помислете за следните две променливи x и y, от вас се изисква да изчислите R на квадрат в регресия.

Решение:

Използвайки гореспоменатата формула, първо трябва да изчислим коефициента на корелация.

Имаме всички стойности в горната таблица с n = 4.

Нека сега въведем стойностите във формулата, за да стигнем до фигурата.

r = (4 * 26 046,25) - (265,18 * 326,89) / √ ((4 * 21 274,94) - (326,89) 2 ) * ((4 * 31 901,89) - (326,89) 2 )

r = 17 501,06 / 17 512,88

Коефициентът на корелация ще бъде

r = 0,99932480

И така, изчислението ще бъде както следва,

r 2 = (0,99932480) 2

R Формула на квадрат в регресия

r 2 = 0,998650052

Пример # 2

Индия, развиваща се страна, иска да проведе независим анализ на това дали промените в цените на суровия петрол са повлияли на стойността на рупията. Следва историята на цената на суровия петрол Brent и оценката на рупиите, както спрямо долари, които преобладават средно за тези години за по-долу.

RBI, централната банка на Индия, се обърна към вас, за да предоставите презентация по същия въпрос на следващата среща. Определете дали движенията в суров петрол влияят върху движенията в рупии за долар?

Решение:

Използвайки формулата за корелацията по-горе, можем първо да изчислим коефициента на корелация. Третиране на средната цена на суровия петрол като една променлива, да речем х, и третиране на рупия за долар като друга променлива като у.

Имаме всички стойности в горната таблица с n = 6.

Нека сега въведем стойностите във формулата, за да стигнем до фигурата.

r = (6 * 23592.83) - (356.70 * 398.59) / √ ((6 * 22829.36) - (356.70) 2 ) * ((6 * 26529.38) - (398.59) 2 )

r = -620,06 / 1,715,95

Коефициентът на корелация ще бъде

r = -0,3614

И така, изчислението ще бъде както следва,

r 2 = (-0,3614) 2

R Формула на квадрат в регресия

r 2 = 0,1306

Анализ: Изглежда, че има незначителна връзка между промените в цените на суровия петрол и промените в цената на индийската рупия. Тъй като цената на суровия петрол нараства, промените в индийската рупия също се отразяват. Но тъй като R на квадрат е само 13%, тогава промените в цената на суровия петрол обясняват много по-малко за промените в индийската рупия, а индийската рупия е обект на промени и в други променливи, което трябва да бъде отчетено.

Пример # 3

Лабораторията XYZ провежда изследвания върху височината и теглото и се интересува дали съществува някаква връзка между тези променливи. След като събра проба от 5000 души за всяка категория и излезе със средно тегло и средна височина в конкретната група.

По-долу са подробностите, които са събрали.

От вас се изисква да изчислите R Squared и да заключите дали този модел обяснява вариациите във височината засяга вариациите в теглото.

Решение:

Използвайки формулата за корелацията по-горе, можем първо да изчислим коефициента на корелация. Третиране на височината като една променлива, да речем x, и третиране на теглото като друга променлива като y.

Имаме всички стойности в горната таблица с n = 6.

Нека сега въведем стойностите във формулата, за да стигнем до фигурата.

r = (7 * 74 058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )

r = 6581,05 / 7075,77

Коефициентът на корелация ще бъде

Коефициент на корелация (r) = 0.9301

И така, изчислението ще бъде както следва,

r 2 = 0,8651

Анализ: Корелацията е положителна и изглежда има известна връзка между височината и теглото. С увеличаването на височината изглежда се увеличава и теглото на човека. Докато R2 предполага, че 86% от промените във височината се дължат на промени в теглото, а 14% са необясними.

Уместност и употреба

Уместността на R на квадрат в регресия е способността му да намери вероятността от бъдещи събития, настъпили в рамките на дадените прогнозирани резултати или резултатите. Ако към модела се добавят повече извадки, тогава коефициентът ще покаже вероятността или вероятността за падане на нова точка или нов набор от данни. Дори ако и двете променливи имат силна връзка, определянето не доказва причинност.

Някои от пространствата, където R квадратът се използва най-вече, е за проследяване на ефективността на взаимните фондове, за проследяване на риска в хедж фондовете, за да се определи колко добре се движи акцията с пазара, където R2 би предложил колко от движенията в акциите могат да бъдат обяснени от движенията на пазара.

Интересни статии...