Какво представлява формулата P-Value?
P е статистическа мярка, която помага на изследователите да определят дали тяхната хипотеза е вярна. Той помага да се определи значимостта на резултатите. Нулевата хипотеза е позиция по подразбиране, че няма връзка между две измерени явления. Той се обозначава с H 0. Алтернативна хипотеза е тази, на която бихте повярвали, ако се счита, че нулевата хипотеза е невярна. Неговият символ е H 1 или H a.
P-стойността в Excel е число между 0 и 1. Има таблици, програми за електронни таблици и статистически софтуер, които помагат да се изчисли p-стойността. Нивото на значимост (α) е предварително определен праг, определен от изследователя. Обикновено е 0,05. Много малка p-стойност, която е по-малка от нивото на значимост, показва, че отхвърляте нулевата хипотеза. P-стойността, която е по-голяма от нивото на значимост, показва, че не успяваме да отхвърлим нулевата хипотеза.
Обяснение на формулата за P-стойност
Формулата за изчисляване на р-стойността може да бъде получена чрез използване на следните стъпки:
Изчисляване на P-стойността от Z статистика
Стъпка 1: Трябва да открием тестовата статистика z
Z = (p̂ - p0) / √ (p0 (1-p0) / n)
Където
- p̂ е примерна пропорция
- p0 е предполагаемо съотношение на населението в нулевата хипотеза
- n е размерът на извадката
Стъпка 2: Трябва да намерим съответното ниво на p от получената стойност z. За тази цел трябва да разгледаме таблицата z.

Източник: www.dummies.com
Например, нека намерим стойността на p, съответстваща на z ≥ 2,81. Тъй като нормалното разпределение е симетрично, отрицателните стойности на z са равни на неговите положителни стойности. 2,81 е сбор от 2,80 и 0,01. Погледнете 2.8 в колоната z и съответната стойност от 0.01. Получаваме p = 0,0025.
Примери за формула с P-стойност (с шаблон на Excel)
Нека да видим няколко прости до усъвършенствани примера на уравнението P-Value, за да го разберем по-добре.
Пример # 1
а) Р-стойността е 0,3015. Ако нивото на значимост е 5%, намерете дали можем да отхвърлим нулевата хипотеза.
б) P-стойността е 0,0129. Ако нивото на значимост е 5%, намерете дали можем да отхвърлим нулевата хипотеза.
Решение:
Използвайте следните данни за изчисляване на P-стойност.

P-Стойността ще бъде -

а) Тъй като р-стойността от 0,3015 е по-голяма от нивото на значимост от 0,05 (5%), не успяваме да отхвърлим нулевата хипотеза.
б) Тъй като р-стойността от 0,0129 е по-малка от нивото на значимост от 0,05, ние отхвърляме нулевата хипотеза.
Пример # 2
27% от хората в Индия говорят хинди според проучване. Изследовател е любопитен дали цифрата е по-висока в селото му. Следователно, рамкират нулевата и алтернативната хипотеза. Той тества H 0: p = 0,27. Ха : р> 0,27. Тук p е делът на хората в селото, които говорят хинди. Той възлага проучване в селото си, за да установи броя на хората, които могат да говорят хинди. Той открива, че 80 от 240 души, включени в извадката, могат да говорят хинди. Разберете приблизителната р-стойност за теста на изследователя, ако трябва да приемем, че са изпълнени необходимите условия и нивото на значимост е 5%.
Решение:
Използвайте следните данни за изчисляване на P-стойност.

Тук размерът на извадката n = 240,
p 0 е делът на населението. Ще трябва да намерим пропорцията на извадката
= 80/240
= 0,33
Z Статистика
Изчисляване на Z статистика


= 0,33 - 0,27 / √ 0,27 * (1 - 0,27) / 240
Z Статистика ще бъде -

Z = 2.093696
P-Стойността ще бъде -

P-стойност = P (z ≥ 2,09)
Трябва да разгледаме стойността на 2.09 е таблицата z. И така, трябва да разгледаме -2,0 в колоната z и стойността в колоната 0,09. Тъй като нормалното разпределение е симетрично, площта вдясно от кривата е равна на тази вляво. Получаваме р-стойността като 0,0183.
Стойност на P = 0,0183
Тъй като р-стойността е по-малка от значимото ниво от 0,05 (5%), ние отхвърляме нулевата хипотеза.
Забележка: В Excel р-стойността идва като 0,0181
Пример # 3
Проучванията показват, че по-голям брой самолетни билети се купуват от мъже в сравнение с жените. Купуват се от мъже и жени в съотношение 2: 1. Изследването е проведено на определено летище в Индия, за да се установи разпределението на самолетните билети сред мъжете и жените. От 150 билета 88 билета са закупени от мъже и 62 от жени. Трябва да разберем дали експерименталната манипулация причинява промяната в резултатите, или наблюдаваме случайна вариация. Изчислете р-стойността, като приемете, че степента на значимост е 0,05.
Решение:
Използвайте следните данни за изчисляване на P-стойност.

Стъпка 1: Наблюдаваната стойност е 88 за мъже и 62 за жени.
- Очаквана стойност за мъже = 2/3 * 150 = 100 мъже
- Очаквана стойност за жени = 1/3 * 150 = 50 жени
Стъпка 2: Разберете хи-квадрат


= ((88-100) 2 ) / 100 + (62-50) 2 /50
= 1,44 + 2,88
Chi-Square (X 2)
Chi-Square (X 2) ще бъде -

Chi-Square (X 2) = 4.32
Стъпка 3: Намерете степента на свобода
Тъй като има 2 променливи - мъже и жени, n = 2
Степени на свобода = n-1 = 2-1 = 1
Стъпка 4: От таблицата p-стойност разглеждаме първия ред в таблицата, тъй като степента на свобода е 1. Можем да видим, че p-стойността е между 0,025 и 0,05. Тъй като р-стойността е по-малка от степента на значимост от 0,05, ние отхвърляме нулевата хипотеза.
P-Стойността ще бъде -

Стойност на P = 0,037666922
Забележка: Excel директно дава р-стойността, използвайки формулата:
CHITEST (действителен диапазон, очакван диапазон)
Пример # 4
Известно е, че 60% от хората, които влизат в магазини за облекло в даден град, купуват нещо. Собственик на магазин за облекло искаше да открие дали броят на магазина за облекло, притежаван от него, е по-голям. Той вече имаше резултатите от проучване, проведено за неговия магазин. 128 от 200 души, влезли в магазина му, са закупили нещо. Собственикът на магазина обозначава pas дела на хората, които влизат в магазина му за облекло и купуват нещо. Поставената от него нулева хипотеза е p = 0,60, а алтернативната хипотеза е p> 0,60. Намерете р-стойността за изследването при ниво на значимост от 5%.
Решение:
Използвайте следните данни за изчисляване на P-стойност.

Тук размерът на извадката n = 200. Ще трябва да намерим пропорцията на извадката
= 128/200
= 0,64
Z Статистика
Изчисляване на Z статистика


= 0,64 - 0,60 / √ 0,60 * (1 - 0,60) / 200
Z Статистика ще бъде -

Z Статистика = 1.1547
Стойност на P = P (z ≥ 1,1547)
Функция NORMSDIST в Excel

NORMSDIST ще бъде -

NORMSDIST = 0.875893461
Има вградена функция за изчисляване на p-стойност от az статистика в Excel. Известна е като функция NORMSDIST. Функцията Excel NORMSDIST изчислява стандартната нормална кумулативна функция на разпределение от предоставена стойност. Форматът му е NORMSDIST (z). Тъй като z статистическата стойност е в клетка B2, използваната функция е = NORMSDIST (B2).
Стойността на P ще бъде -

Стойност на P = 0,12410654
Тъй като трябва да намерим областта вдясно от кривата,
р-стойност = 1 - 0,875893 = 0,124107
Тъй като р-стойността на 0,124107 е повече от значително ниво от 0,05, не успяваме да отхвърлим нулевата хипотеза.
Уместност и употреба
P-Value има широко приложение при тестване на статистически хипотези, по-специално при тестване на нулеви хипотези. Например, управител на фонд управлява взаимен фонд. Той твърди, че възвръщаемостта от дадена схема на взаимния фонд е еквивалентна на Nifty, която е еталонният индекс на фондовия пазар. Той ще формулира нулевата хипотеза, че възвръщаемостта на схемата за взаимен фонд е еквивалентна на тази на Nifty. Алтернативната хипотеза би била, че възвръщаемостта на схемата и възвръщаемостта на Nifty не са еквивалентни. След това ще изчисли р-стойността.