Регресия (значение, типове) - Какво е регресионен анализ?

Съдържание

Какво е регресия?

Регресионният анализ е статистическо измерване, използвано във финанси, инвестиции и др., Което има за цел да установи връзка между зависима променлива и други серии от независими променливи, а основният фокус е определянето на силата на горната връзка.

Обяснения

  • За да обясним регресионния анализ в неспециализиран мандат, нека приемем, че ръководителят на продажбите на компанията се опитва усилено да прогнозира продажбите за следващия месец. Включени са многобройни фактори, които движат продажбите на продукта, като се започне от времето до новата стратегия, фестивал и промяна в начина на живот на потребителите на конкурента.
  • Това е метод за изравняване от няколко фактора, които влияят върху продажбата, които са тези, които имат най-голямо въздействие. Тя може да помогне при отговорите на много въпроси като кои са най-важните фактори, кои фактори са по-малко важни, каква е връзката между тези фактори и най-важното каква е гаранцията за тези фактори.
  • Тези фактори се наричат ​​променливи. Основният фактор, който се опитваме да прогнозираме, се нарича зависима променлива, а останалите фактори, които оказват влияние върху зависимата променлива, се наричат ​​независими променливи.

Формула

Простият линеен регресионен анализ в Excel може да бъде изразен като формулата по-долу и измерва връзката между зависима променлива и една независима променлива.

Y = a + bX + ϵ

Тук:

  • Y - Зависима променлива
  • X - Независима (обяснителна) променлива
  • а - Прихващане
  • б - наклон
  • ϵ - остатъчен (грешка)

Как да тълкувам регресионния анализ?

Това може да се тълкува, като се приеме прост сценарий. Тук вземаме връзката между цените на античната колекция на търг и продължителността на нейната възраст. Колкото повече един антик остарява, толкова повече цена получава. Ако приемем, че сме задали данни за последните 50 артикула, които са били продадени на търг, можем да прогнозираме какви ще са бъдещите тръжни цени въз основа на възрастта на артикула. Използвайки тези данни, можем да изградим уравнение за регресия.

Формулата за регресия, която може да установи връзка между възрастта и цената, е както следва:

y = β0 + β1 x + грешка
  • Тук зависимият фактор е Y. Y представлява цената на всеки артикул, който ще се продава на търг, докато независимият фактор е X, който определя възрастта.
  • Параметрите β0 и β1 са параметри, които не са известни и ще бъдат оценени от уравнението.
  • β0 е константа, която се използва за дефиниране на линейната линия на тренда, пресича оста Y.
  • β1 е константа, която показва степента на промяна в стойността на зависимата променлива като свързана функция на промяната, подразбираща се към независимите променливи.
  • Това основно се нарича наклон на уравнението. Когато наклонът е подложка, това означава, че има пропорционална връзка между възрастта и цената, а когато наклонът е обратен, това означава, че връзката е косвено пропорционална.
  • На грешката може да се дефинира като шум или промяна в целевата променлива и е случаен характер.

Реални примери за регресионен анализ

Нека приемем, че трябва да установим връзка между извършените продажби и сумата, похарчена за реклама, свързана с продукт.

Като цяло можем да наблюдаваме положителна връзка между количеството продажби и сумата, похарчена за реклама. Съчетавайки просто уравнение за линейна регресия, имаме:

Y = a + bX

Да предположим, че получаваме стойността като

Y = 500 + 30X

Тълкуване на резултата:

Прогнозираният наклон от 30 ни помага да направим заключението, че средните продажби се увеличават с 30 долара годишно, тъй като разходите за реклама се увеличават.

Видове регресионен анализ

# 1 - Линеен

Това може да се изрази като формулата по-долу и измерва връзката между зависима променлива и една независима променлива.

# 2 - Полином

При този метод анализът се използва за измерване на връзката между единични зависими фактори и множество независими променливи.

# 3 - Логистика

Тук зависимият фактор или променлива има двоичен характер. Независимите променливи могат да бъдат непрекъснати или двоични. При многочленната логистична регресия можем да си позволим да имаме повече от две категории, докато избираме нашата независима променлива.

# 4 - Квантил

Това е адитивна концепция за линейна регресия и се използва главно, когато в данните присъстват отклонения и изкривяване.

# 5 - Еластична мрежа

Това е полезно, когато човек обработва много високо корелирани независими променливи.

# 6 - Регресия на основните компоненти (PCR)

Това е техника, която е приложима, когато в данните има твърде много независими променливи или мултиколинеарност

# 7 - Частични най-малки квадратчета (PLS)

Това е противоположен метод на основния компонент, където имаме независими променливи, силно корелирани. Той е приложим и когато има много независими променливи.

# 8 - Вектор за поддръжка

Това може да осигури решение за линейни и нелинейни модели. Той използва нелинейни функции на ядрото, за да намери оптималното решение за нелинейни модели.

# 9 - Пореден

Приложим е за прогнозиране на класирани стойности. По принцип е подходящо, когато зависимата променлива е с пореден характер

# 10 - Поасон

Това е приложимо, когато зависимата променлива има данни за броя.

# 11 - Отрицателен бином

Също така е приложимо да се управляват данните за броенето само, че отрицателната биномиална регресия не предполага разпределение на броя с дисперсия, равна на средната му стойност, докато регресията на Поасон приема дисперсията, равна на средната му стойност.

# 12 - Квази Поасон

Той е заместител на отрицателната биномна регресия. Приложим е и за разпръснати данни за броене. Дисперсията на квазипоазонов модел е линейна функция на средната стойност, докато дисперсията на отрицателен биномиален модел е квадратична функция на средната стойност.

# 13 - Кокс

Той се използва по-скоро за анализ на данни от времето до събитието.

Разлика между регресия и корелация

  • Регресията установява връзката между независима дисперсия и зависима променлива, когато и двете променливи са различни, докато корелацията определя връзката или зависимостта на две променливи, когато няма разлика между двете променливи.
  • Основната цел на регресията е да се създаде линия с най-добро съответствие и оценката на една променлива се извършва въз основа на други, докато в корелация демонстрира линейната връзка между две променливи.
  • В това оценяваме величината на определена промяна в разпознатата променлива (X) върху оценената променлива (Y), докато в корелация коефициентът се използва за измерване до каква степен двете променливи се движат заедно.
  • Това е процес на оценка на величината на случайни независими променливи въз основа на величината на статична зависима променлива, докато корелацията ни помага да решим определена стойност, за да изразим взаимозависимостта между двете променливи.

Заключение

  • Регресионният анализ използва предимно данни, за да установи връзка между две или повече променливи. Тук се предполага, че отношенията, съществуващи в миналото, ще се отразяват и в настоящето или бъдещето. Малцина смятат това за изоставане във времето между минало и настояще / бъдеще.
  • Това обаче е широко използвана техника за прогнозиране и оценка. Въпреки че включва математика, която много потребители могат да намерят за трудна, техниката е сравнително лесна за използване, особено когато е наличен модел.

Интересни статии...