Нормално разпределение в статистиката - определение, пример, интерпретация

Съдържание

Какво е нормалното разпределение в статистиката?

Какво е нормалното разпределение в статистиката?

Нормално разпределение е крива на разпределение на честотата във формата на камбана, която помага да се опишат всички възможни стойности, които случайна променлива може да вземе в рамките на даден диапазон, като по-голямата част от областта на разпределение е в средата, а малко са в опашките, в крайностите. Това разпределение има два ключови параметъра: средната стойност (µ) и стандартното отклонение (σ), което играе ключова роля при изчисляването на възвръщаемостта на активите и в стратегията за управление на риска.

Как да тълкуваме нормалното разпределение

Горната фигура показва, че статистическото нормално разпределение е камбановидна крива. Обхватът на възможните резултати от това разпределение е целите реални числа, лежащи между -∞ до + ∞. Опашките на кривата на камбаната се простират от двете страни на диаграмата (+/-) без ограничения.

Приблизително 68% от всички наблюдения попадат в рамките на +/- едно стандартно отклонение (σ)
Приблизително 95% от всички наблюдения попадат в рамките на +/- две стандартни отклонения (σ)
Приблизително 99% от всички наблюдения попадат в рамките на +/- три стандартни отклонения (σ)

Той има изкривяване на нулата (симетрия на разпределение). Ако разпределението на данните е асиметрично, тогава разпределението е неравномерно, ако наборът от данни има изкривяване, по-голямо от нула или положително изкривяване. Тогава дясната опашка на разпределението е по-удължена от лявата, а при отрицателно изкривяване (по-малко от нула) лявата опашка ще бъде по-дълга от дясната опашка.

Той има куртоза 3 (измерва пиковата точка на разпределение), което показва, че разпределението не е нито прекалено върхово, нито твърде тънки опашки. Ако куртозата е повече от три, отколкото разпределението е по-пиково с по-дебели опашки, а ако куртозата е по-малко от три, тогава тя има тънки опашки и върховата точка е по-ниска от нормалното разпределение.

Характеристики

Те представляват семейство на разпределение, където средното и отклонението определят формата на разпределение.
Средната, медианата и начинът на това разпределение са равни.
Половината от стойностите са вляво от центъра, а другата половина вдясно.
Общата стойност под стандартната крива винаги ще бъде една.
Най-вероятно разпределението е в центъра и по-малко стойности лежат в края на опашката.

Трансформация (Z)

Функцията за вероятностна плътност (PDF) на случайна променлива (X) след разпределение се дава от:

където -∞ <x <∞; -∞ <µ 0

Където,

F (x) = Нормална вероятност Функция
x = случайна променлива
µ = Средно за разпределение
σ = Стандартно отклонение на разпределението
π = 3,14159
e = 2,71828

Формула за трансформация

Където,

X = случайна променлива

Примери за нормално разпределение в статистиката

Нека обсъдим следните примери.

Пример # 1

Да предположим, че дадена компания има 10000 служители и множество структури на заплатите според ролята на работата, в която служителят работи. Заплатите обикновено се разпределят със средното население от µ = 60 000 $ и стандартното отклонение на населението σ = 15000 $. Каква ще е вероятността случайно избраният служител да има заплата под $ 45000 годишно.

Решение

Както е показано на горната фигура, за да отговорим на този въпрос, трябва да открием площта под нормалната крива от 45 до лявата странична опашка. Също така трябва да използваме стойността на Z-таблицата, за да получим верния отговор.

Първо, трябва да преобразуваме даденото средно и стандартно отклонение в стандартно нормално разпределение със средно (µ) = 0 и стандартно отклонение (σ) = 1, използвайки формулата за преобразуване.

След преобразуването трябва да потърсим Z-таблицата, за да открием съответната стойност, която ще ни даде верния отговор.

Като се има предвид,

Средна стойност (µ) = $ 60,000
Стандартно отклонение (σ) = $ 15000
Случайна променлива (x) = $ 45000

Трансформация (z) = (45000 - 60000/15000)

Трансформация (z) = -1

Сега стойността, която е еквивалентна на -1 в Z-таблица, е 0,1587, което представлява площта под кривата от 45 в посока наляво. То посочва, че когато избираме на случаен принцип служител, вероятността да спечелим по-малко от 45000 $ годишно е 15,87%.

Пример # 2

Придържайки се към същия сценарий, както по-горе, разберете вероятността случайно избраният служител да печели повече от $ 80 000 годишно, използвайки нормалното разпределение.

Решение

Така че в този въпрос трябва да открием засенчената област от 80 до дясната опашка, използвайки същата формула.

Като се има предвид,

Средна стойност (µ) = $ 60,000
Стандартно отклонение (σ) = $ 15000
Случайна променлива (X) = $ 80,000

Трансформация (z) = (80000 - 60000/15000)

Трансформация (z) = 1,33

Съгласно Z-таблицата, еквивалентната стойност на 1,33 е 0,9082 или 90,82%, което показва, че вероятността за произволен избор на служители, които печелят по-малко от 80 000 долара годишно, е 90,82%.

Но по въпроса трябва да определим вероятността случайните служители да печелят повече от $ 80 000 годишно, така че трябва да извадим стойността от 100.

Случайна променлива (X) = 100% - 90,82%
Случайна променлива (X) = 9,18%

Така че вероятността служителите да печелят повече от $ 80 000 годишно е 9,18%.

Използва

Техническата диаграма на фондовия пазар често е крива, позволяваща на анализаторите и инвеститорите да правят статистически изводи за очакваната възвръщаемост и риска от акциите.
Той се използва в реалния свят, като за определяне на най-вероятното най-добро време, необходимо на пицарските компании за доставка на пица и много повече реални приложения.
Използва се за сравняване на височини на даден набор от популации, при които повечето хора ще имат среден размер, като много малко хора имат над средния или под средния ръст.
Те се използват при определяне на средното академично представяне на студентите, което помага да се сравни рангът на студентите.

Заключение

Нормалното разпространение намира приложение в науката за данни и анализа на данните. Усъвършенстваните технологии като изкуствен интелект и машинно обучение, използвани заедно с тази дистрибуция, могат да дадат по-добро качество на данните, което ще помогне на хората и компаниите при ефективното вземане на решения.