Нормално разпределение в статистиката - определение, пример, интерпретация

Какво е нормалното разпределение в статистиката?

Нормално разпределение е крива на разпределение на честотата във формата на камбана, която помага да се опишат всички възможни стойности, които случайна променлива може да вземе в рамките на даден диапазон, като по-голямата част от областта на разпределение е в средата, а малко са в опашките, в крайностите. Това разпределение има два ключови параметъра: средната стойност (µ) и стандартното отклонение (σ), което играе ключова роля при изчисляването на възвръщаемостта на активите и в стратегията за управление на риска.

Как да тълкуваме нормалното разпределение

Горната фигура показва, че статистическото нормално разпределение е камбановидна крива. Обхватът на възможните резултати от това разпределение е целите реални числа, лежащи между -∞ до + ∞. Опашките на кривата на камбаната се простират от двете страни на диаграмата (+/-) без ограничения.

  • Приблизително 68% от всички наблюдения попадат в рамките на +/- едно стандартно отклонение (σ)
  • Приблизително 95% от всички наблюдения попадат в рамките на +/- две стандартни отклонения (σ)
  • Приблизително 99% от всички наблюдения попадат в рамките на +/- три стандартни отклонения (σ)

Той има изкривяване на нулата (симетрия на разпределение). Ако разпределението на данните е асиметрично, тогава разпределението е неравномерно, ако наборът от данни има изкривяване, по-голямо от нула или положително изкривяване. Тогава дясната опашка на разпределението е по-удължена от лявата, а при отрицателно изкривяване (по-малко от нула) лявата опашка ще бъде по-дълга от дясната опашка.

Той има куртоза 3 (измерва пиковата точка на разпределение), което показва, че разпределението не е нито прекалено върхово, нито твърде тънки опашки. Ако куртозата е повече от три, отколкото разпределението е по-пиково с по-дебели опашки, а ако куртозата е по-малко от три, тогава тя има тънки опашки и върховата точка е по-ниска от нормалното разпределение.

Характеристики

  • Те представляват семейство на разпределение, където средното и отклонението определят формата на разпределение.
  • Средната, медианата и начинът на това разпределение са равни.
  • Половината от стойностите са вляво от центъра, а другата половина вдясно.
  • Общата стойност под стандартната крива винаги ще бъде една.
  • Най-вероятно разпределението е в центъра и по-малко стойности лежат в края на опашката.

Трансформация (Z)

Функцията за вероятностна плътност (PDF) на случайна променлива (X) след разпределение се дава от:

където -∞ <x <∞; -∞ <µ 0

Където,

  • F (x) = Нормална вероятност Функция
  • x = случайна променлива
  • µ = Средно за разпределение
  • σ = Стандартно отклонение на разпределението
  • π = 3,14159
  • e = 2,71828

Формула за трансформация

Където,

  • X = случайна променлива

Примери за нормално разпределение в статистиката

Нека обсъдим следните примери.

Пример # 1

Да предположим, че дадена компания има 10000 служители и множество структури на заплатите според ролята на работата, в която служителят работи. Заплатите обикновено се разпределят със средното население от µ = 60 000 $ и стандартното отклонение на населението σ = 15000 $. Каква ще е вероятността случайно избраният служител да има заплата под $ 45000 годишно.

Решение

Както е показано на горната фигура, за да отговорим на този въпрос, трябва да открием площта под нормалната крива от 45 до лявата странична опашка. Също така трябва да използваме стойността на Z-таблицата, за да получим верния отговор.

Първо, трябва да преобразуваме даденото средно и стандартно отклонение в стандартно нормално разпределение със средно (µ) = 0 и стандартно отклонение (σ) = 1, използвайки формулата за преобразуване.

След преобразуването трябва да потърсим Z-таблицата, за да открием съответната стойност, която ще ни даде верния отговор.

Като се има предвид,

  • Средна стойност (µ) = $ 60,000
  • Стандартно отклонение (σ) = $ 15000
  • Случайна променлива (x) = $ 45000

Трансформация (z) = (45000 - 60000/15000)

Трансформация (z) = -1

Сега стойността, която е еквивалентна на -1 в Z-таблица, е 0,1587, което представлява площта под кривата от 45 в посока наляво. То посочва, че когато избираме на случаен принцип служител, вероятността да спечелим по-малко от 45000 $ годишно е 15,87%.

Пример # 2

Придържайки се към същия сценарий, както по-горе, разберете вероятността случайно избраният служител да печели повече от $ 80 000 годишно, използвайки нормалното разпределение.

Решение

Така че в този въпрос трябва да открием засенчената област от 80 до дясната опашка, използвайки същата формула.

Като се има предвид,

  • Средна стойност (µ) = $ 60,000
  • Стандартно отклонение (σ) = $ 15000
  • Случайна променлива (X) = $ 80,000

Трансформация (z) = (80000 - 60000/15000)

Трансформация (z) = 1,33

Съгласно Z-таблицата, еквивалентната стойност на 1,33 е 0,9082 или 90,82%, което показва, че вероятността за произволен избор на служители, които печелят по-малко от 80 000 долара годишно, е 90,82%.

Но по въпроса трябва да определим вероятността случайните служители да печелят повече от $ 80 000 годишно, така че трябва да извадим стойността от 100.

  • Случайна променлива (X) = 100% - 90,82%
  • Случайна променлива (X) = 9,18%

Така че вероятността служителите да печелят повече от $ 80 000 годишно е 9,18%.

Използва

  • Техническата диаграма на фондовия пазар често е крива, позволяваща на анализаторите и инвеститорите да правят статистически изводи за очакваната възвръщаемост и риска от акциите.
  • Той се използва в реалния свят, като за определяне на най-вероятното най-добро време, необходимо на пицарските компании за доставка на пица и много повече реални приложения.
  • Използва се за сравняване на височини на даден набор от популации, при които повечето хора ще имат среден размер, като много малко хора имат над средния или под средния ръст.
  • Те се използват при определяне на средното академично представяне на студентите, което помага да се сравни рангът на студентите.

Заключение

Нормалното разпространение намира приложение в науката за данни и анализа на данните. Усъвършенстваните технологии като изкуствен интелект и машинно обучение, използвани заедно с тази дистрибуция, могат да дадат по-добро качество на данните, което ще помогне на хората и компаниите при ефективното вземане на решения.

Интересни статии...