Емпирично правило - определение, формула, как да се използва в статистиката?

Какво е емпиричното правило в статистиката?

Емпиричното правило в статистиката гласи, че почти всички (95%) от наблюденията при нормално разпределение се намират в рамките на 3 стандартни отклонения от средното. Това е много важно правило и помага при прогнозирането.

Формула

Формулата показва прогнозирания процент наблюдения, които ще се намират в рамките на всяко стандартно отклонение от средното.

Правилото казва, че:

  • 68% от наблюденията ще бъдат в рамките на +/- 1 стандартно отклонение от средната стойност
  • 95% от наблюденията ще бъдат в рамките на +/- 2 стандартни отклонения от средната стойност
  • 7% от наблюденията ще бъдат в рамките на +/- 3 стандартни отклонения от средната стойност

Как да използвам?

Това се използва в тенденцията за прогнозиране на набор от данни. Когато наборът от данни е обширен и е предизвикателно да се изследва цялата популация, тогава към извадката може да се приложи Емпирично правило, за да се получи оценка на това как ще реагират данните в популацията, ако бъдете помолени да намерите средната заплата на всички счетоводителите в САЩ. Тогава това е трудна за изпълнение задача, тъй като зададената популация е огромна. Така че, в този случай можете да изберете, да речем, 90 наблюдения на случаен принцип от цялата популация.

Така че сега ще имате 90 заплати. Трябва да намерите средното и стандартното отклонение на наблюденията. Ако наблюдението следва нормално разпределение, това може да се приложи и може да се направи оценка на заплатата на всички счетоводители в САЩ.

Да кажем, че средната заплата на извадката е 90 000 $. А стандартното отклонение е 5000 долара. Така че от цялото население 68% от счетоводителите получават заплата, варираща между +/- 1Стандартни отклонения от средната стойност. Тъй като средната стойност е $ 90 000, а стандартното отклонение е $ 5 000. Така че 68% от всички счетоводители в САЩ се плащат в диапазона от $ 90 000 +/- (1 * $ 5000). Това е в рамките на 85 000 до 95 000 долара

Ако разпространим малко повече, тогава 95% от всички счетоводители в САЩ се плащат в диапазона от средни +/- 2 стандартни отклонения. $ 90 000 +/- (2 * 5000). Така че диапазонът е от 80 000 до 100 000 долара.

В по-широк диапазон 99,7% от всички счетоводители получават заплати, вариращи от Средни +/- 3Стандартни отклонения. Това е 90 000 +/- (3 * 5000). Диапазонът е от 75 000 до 105 000 долара

Можете ясно да видите, че без да се изследва цялото население, може да се направи оценка по отношение на популацията. Ако някой планира да работи като счетоводител в САЩ, тогава той лесно може да очаква, че заплатата му ще варира от 75 000 до 105 000 долара

Този вид оценка помага да се улесни работата и да се правят прогнози за бъдещето.

Примери за емпирични правила

Г-н Х се опитва да намери средния брой години, през които човек преживява след пенсиониране, като се има предвид, че възрастта за пенсиониране е 60. Ако Средните години на оцеляване от 50 случайни наблюдения са 20 години и SD е 3, тогава открийте вероятността, че човек ще тегли пенсия за повече от 23 години

Решение

Емпиричното правило гласи, че 68% от наблюденията ще бъдат в рамките на 1 стандартно отклонение от средното. Тук средната стойност на наблюденията е 20.

68% от наблюденията ще бъдат в рамките на 20 +/- 1 (стандартно отклонение), което е 20 +/- 3. Така че диапазонът е от 17 до 23.

Има 68% шанс минималните години, които човек преживява след пенсиониране, да са между 17 и 23. Сега процентът, който е извън този диапазон, е (100 - 68) = 32%. 32 се разпределя равномерно и от двете страни, което означава 16% шанс минималните години да бъдат под 17 и 16% шанс минималните години да бъдат по-големи от 23.

Така че вероятността лицето да вземе повече от 23 години пенсия е 16%.

Емпирично правило срещу теоремата на Чебишев

Емпиричното правило се прилага към набори от данни, които следват нормално разпределение, което означава звънче. При нормално разпределение и двете страни на разпределението имат 50% вероятност всяка.

Ако наборът от данни не се разпределя нормално, тогава има друго приближение или правило, което се прилага за всички видове набори от данни, което е теоремата на Чебишев. Той казва три неща:

  • Най-малко 3/4 та от всички наблюдения, ще бъде в рамките 2Standard отклонения от средната стойност. Това е силно приближение. Това означава, че ако има 100 наблюдения, а след това 3/4 та от наблюденията, които са 75 наблюдения ще са в границите на +/- 2 стандартни отклонения от средната стойност.
  • Най-малко 8/9 та от всички наблюдения ще бъде в рамките 3Standard отклонения от средната стойност.
  • Най-малко 1 - 1 / k 2 от всички наблюдения се намират в рамките на K Стандартни отклонения от средната стойност. Тук K се нарича всяко цяло число.

Кога да се използва?

Данните са като златото в съвременния свят. Има огромни данни, произтичащи от различни източници и се използват за различни сближения или прогнози. Ако набор от данни следва нормално разпределение, той показва крива във форма на колокол; след това може да се използва емпирично правило. Той се прилага за наблюдения, за да се създаде приблизителна оценка за популацията.

След като се види, че наблюденията показват нормална структура на разпределение, тогава се следва Емпиричното правило, за да се намерят няколко вероятности за наблюденията. Правилото е изключително полезно за много статистически прогнози.

Заключение

Емпиричното правило е статистическа концепция, която помага да се изобрази вероятността от наблюдения и е много полезна при намиране на приближение на огромна популация. Винаги трябва да се отбележи, че това са приближения. Винаги има шансове за извънредни стойности, които да не попаднат в разпределението. Така че констатациите не са точни и трябва да се вземат предпазни мерки, когато се действа според прогнозата.

Интересни статии...