Регресия на най-малките квадрати - как да създадем най-добрата линия?

Определение на метода за регресия с най-малки квадрати

Методът на регресия с най-малки квадрати е форма на регресионен анализ, който установява връзката между зависимата и независимата променлива заедно с линейна линия. Този ред се нарича „линия на най-доброто приспособяване“.

Регресионният анализ е статистически метод, с помощта на който може да се изчислят или прогнозират неизвестните стойности на една променлива от известните стойности на друга променлива. Променливата, която се използва за прогнозиране на променливата лихва, се нарича независима или обяснителна променлива, а променливата, която се предвижда, се нарича зависима или обяснена променлива.

Нека разгледаме две променливи, x & y. Те са нанесени на графика със стойности на x на оста x на оста на y на оста y. Тези стойности са представени с точките на графиката по-долу. През точките се изчертава права линия - наричана линията на най-доброто прилягане.

Целта на регресията на най-малките квадрати е да се гарантира, че линията, изтеглена през предоставения набор от стойности, установява най-тясната връзка между стойностите.

Формула за регресия с най-малки квадрати

Линията на регресия по метода на най-малките квадрати се изчислява по следната формула -

ŷ = a + bx

Където,

  • ŷ = зависима променлива
  • x = независима променлива
  • a = y-прихващане
  • b = наклон на линията

Наклонът на линия b се изчислява по следната формула -

Или

Y-прихващане, 'a' се изчислява, като се използва следната формула

Линия на най-подходящо в най-малката квадратна регресия

Линията на най-доброто прилягане е права линия, изтеглена чрез разпръскване на точки от данни, която най-добре представя връзката между тях.

Нека разгледаме следната графика, в която набор от данни се нанася по оста x и y. Тези точки от данни са представени с помощта на сините точки. През тези точки се изчертават три линии - зелена, червена и синя линия. Зелената линия преминава през една точка, а червената линия преминава през три точки с данни. Синята линия обаче преминава през четири точки с данни и разстоянието между остатъчните точки до синята линия е минимално в сравнение с другите две линии.

В горната графика синята линия представлява линията на най-добро прилягане, тъй като тя се намира най-близо до всички стойности и разстоянието между точките извън линията до линията е минимално (т.е. разстоянието между остатъците до линията на най-добро прилягане - наричани също суми на квадрати на остатъци). В другите два реда, оранжевия и зеления, разстоянието между остатъците до линиите е по-голямо в сравнение със синята линия.

Методът на най-малките квадрати осигурява най-тясната връзка между зависимите и независимите променливи чрез минимизиране на разстоянието между остатъците и линията на най-добро прилягане, т.е. сумата на квадратите на остатъците е минимална при този подход. Оттук и терминът „най-малките квадрати“.

Примери за най-малка квадратична регресионна линия

Нека приложим тези формули в въпроса по-долу -

Пример # 1

Подробностите, отнасящи се до опита на техниците в дадена компания (след няколко години) и рейтинга на тяхната производителност са дадени в таблицата по-долу. Използвайки тези стойности, оценете ефективността на техник с 20 години опит.

Опит на техник (в години) Рейтинг на ефективността
16. 87
12 88
18. 89
4 68
3 78
10 80
5 75
12 83

Решение -

За да изчислим първо най-малките квадрати, ще изчислим Y-отсечката (a) и наклон на линия (b), както следва -

Наклонът на Линията (b)

  • б = 6,727 - ((80 * 648) / 8 ) / 1018 - ((80) 2 /8)
  • = 247/218
  • = 1,13

Y-прихващане (а)

  • a = 648 - (1,13) (80) / 8
  • = 69,7

Линията на регресия се изчислява, както следва -

Замествайки стойността на x във формулата 20,

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

Оценката за ефективност на техник с 20 години опит се оценява на 92,3.

Пример # 2

Уравнение за регресия с най-малки квадрати с помощта на Excel

Уравнението за регресия на най-малките квадрати може да бъде изчислено с помощта на Excel чрез следните стъпки -

  • Вмъкнете таблицата с данни в Excel.
  • Поставете разпръсната графика, като използвате точките с данни.
  • Поставете линия на тенденция в графика на разсейване.
  • Под опции за трендова линия - изберете линейна трендова линия и изберете уравнение за показване на диаграмата.
  • Уравнението за регресия на най-малките квадрати за дадения набор от данни на Excel се показва на диаграмата.

По този начин се изчислява уравнението за регресия на най-малките квадрати за дадения набор от данни на Excel. Използвайки уравнението, могат да се правят прогнози и анализи на тенденции. Инструментите на Excel също предоставят подробни изчисления на регресия.

Предимства

  • Методът за регресионен анализ с най-малки квадрати е най-подходящ за модели за прогнозиране и анализ на тенденции. Най-добре се използва в областите на икономиката, финансите и фондовите пазари, където стойността на всяка бъдеща променлива се прогнозира с помощта на съществуващите променливи и връзката между същите.
  • Методът на най-малките квадрати осигурява най-близката връзка между променливите. Разликата между сумите на квадратите на остатъците до линията на най-добро прилягане е минимална при този метод.
  • Механизмът за изчисление е лесен и лесен за прилагане.

Недостатъци

  • Методът на най-малките квадрати разчита на установяване на най-близката връзка между даден набор от променливи. Механизмът за изчисление е чувствителен към данните и в случай на някакви отклонения (изключителни данни), резултатите могат да имат тенденция да повлияят значително.
  • Този тип изчисление е най-подходящ за линейни модели. За нелинейни уравнения се прилагат по-изчерпателни изчислителни механизми.

Заключение

Методът с най-малките квадрати е един от най-популярните методи за прогнозиране на модели и анализ на тенденции. Когато се изчисли по подходящ начин, той дава най-добри резултати.

Интересни статии...