Какво е нормалното разпределение в статистиката?
Нормално разпределение е крива на разпределение на честотата във формата на камбана, която помага да се опишат всички възможни стойности, които случайна променлива може да вземе в рамките на даден диапазон, като по-голямата част от областта на разпределение е в средата, а малко са в опашките, в крайностите. Това разпределение има два ключови параметъра: средната стойност (µ) и стандартното отклонение (σ), което играе ключова роля при изчисляването на възвръщаемостта на активите и в стратегията за управление на риска.
Как да тълкуваме нормалното разпределение

Горната фигура показва, че статистическото нормално разпределение е камбановидна крива. Обхватът на възможните резултати от това разпределение е целите реални числа, лежащи между -∞ до + ∞. Опашките на кривата на камбаната се простират от двете страни на диаграмата (+/-) без ограничения.
- Приблизително 68% от всички наблюдения попадат в рамките на +/- едно стандартно отклонение (σ)
- Приблизително 95% от всички наблюдения попадат в рамките на +/- две стандартни отклонения (σ)
- Приблизително 99% от всички наблюдения попадат в рамките на +/- три стандартни отклонения (σ)
Той има изкривяване на нулата (симетрия на разпределение). Ако разпределението на данните е асиметрично, тогава разпределението е неравномерно, ако наборът от данни има изкривяване, по-голямо от нула или положително изкривяване. Тогава дясната опашка на разпределението е по-удължена от лявата, а при отрицателно изкривяване (по-малко от нула) лявата опашка ще бъде по-дълга от дясната опашка.
Той има куртоза 3 (измерва пиковата точка на разпределение), което показва, че разпределението не е нито прекалено върхово, нито твърде тънки опашки. Ако куртозата е повече от три, отколкото разпределението е по-пиково с по-дебели опашки, а ако куртозата е по-малко от три, тогава тя има тънки опашки и върховата точка е по-ниска от нормалното разпределение.
Характеристики
- Те представляват семейство на разпределение, където средното и отклонението определят формата на разпределение.
- Средната, медианата и начинът на това разпределение са равни.
- Половината от стойностите са вляво от центъра, а другата половина вдясно.
- Общата стойност под стандартната крива винаги ще бъде една.
- Най-вероятно разпределението е в центъра и по-малко стойности лежат в края на опашката.

Трансформация (Z)
Функцията за вероятностна плътност (PDF) на случайна променлива (X) след разпределение се дава от:

където -∞ <x <∞; -∞ <µ 0
Където,
- F (x) = Нормална вероятност Функция
- x = случайна променлива
- µ = Средно за разпределение
- σ = Стандартно отклонение на разпределението
- π = 3,14159
- e = 2,71828
Формула за трансформация

Където,
- X = случайна променлива
Примери за нормално разпределение в статистиката
Нека обсъдим следните примери.
Пример # 1
Да предположим, че дадена компания има 10000 служители и множество структури на заплатите според ролята на работата, в която служителят работи. Заплатите обикновено се разпределят със средното население от µ = 60 000 $ и стандартното отклонение на населението σ = 15000 $. Каква ще е вероятността случайно избраният служител да има заплата под $ 45000 годишно.

Решение
Както е показано на горната фигура, за да отговорим на този въпрос, трябва да открием площта под нормалната крива от 45 до лявата странична опашка. Също така трябва да използваме стойността на Z-таблицата, за да получим верния отговор.
Първо, трябва да преобразуваме даденото средно и стандартно отклонение в стандартно нормално разпределение със средно (µ) = 0 и стандартно отклонение (σ) = 1, използвайки формулата за преобразуване.
След преобразуването трябва да потърсим Z-таблицата, за да открием съответната стойност, която ще ни даде верния отговор.
Като се има предвид,
- Средна стойност (µ) = $ 60,000
- Стандартно отклонение (σ) = $ 15000
- Случайна променлива (x) = $ 45000
Трансформация (z) = (45000 - 60000/15000)
Трансформация (z) = -1
Сега стойността, която е еквивалентна на -1 в Z-таблица, е 0,1587, което представлява площта под кривата от 45 в посока наляво. То посочва, че когато избираме на случаен принцип служител, вероятността да спечелим по-малко от 45000 $ годишно е 15,87%.
Пример # 2
Придържайки се към същия сценарий, както по-горе, разберете вероятността случайно избраният служител да печели повече от $ 80 000 годишно, използвайки нормалното разпределение.

Решение
Така че в този въпрос трябва да открием засенчената област от 80 до дясната опашка, използвайки същата формула.
Като се има предвид,
- Средна стойност (µ) = $ 60,000
- Стандартно отклонение (σ) = $ 15000
- Случайна променлива (X) = $ 80,000
Трансформация (z) = (80000 - 60000/15000)
Трансформация (z) = 1,33
Съгласно Z-таблицата, еквивалентната стойност на 1,33 е 0,9082 или 90,82%, което показва, че вероятността за произволен избор на служители, които печелят по-малко от 80 000 долара годишно, е 90,82%.
Но по въпроса трябва да определим вероятността случайните служители да печелят повече от $ 80 000 годишно, така че трябва да извадим стойността от 100.
- Случайна променлива (X) = 100% - 90,82%
- Случайна променлива (X) = 9,18%
Така че вероятността служителите да печелят повече от $ 80 000 годишно е 9,18%.
Използва
- Техническата диаграма на фондовия пазар често е крива, позволяваща на анализаторите и инвеститорите да правят статистически изводи за очакваната възвръщаемост и риска от акциите.
- Той се използва в реалния свят, като за определяне на най-вероятното най-добро време, необходимо на пицарските компании за доставка на пица и много повече реални приложения.
- Използва се за сравняване на височини на даден набор от популации, при които повечето хора ще имат среден размер, като много малко хора имат над средния или под средния ръст.
- Те се използват при определяне на средното академично представяне на студентите, което помага да се сравни рангът на студентите.
Заключение
Нормалното разпространение намира приложение в науката за данни и анализа на данните. Усъвършенстваните технологии като изкуствен интелект и машинно обучение, използвани заедно с тази дистрибуция, могат да дадат по-добро качество на данните, което ще помогне на хората и компаниите при ефективното вземане на решения.