Формула на стойност P - Примери стъпка по стъпка за изчисляване на P-стойността

Какво представлява формулата P-Value?

P е статистическа мярка, която помага на изследователите да определят дали тяхната хипотеза е вярна. Той помага да се определи значимостта на резултатите. Нулевата хипотеза е позиция по подразбиране, че няма връзка между две измерени явления. Той се обозначава с H 0. Алтернативна хипотеза е тази, на която бихте повярвали, ако се счита, че нулевата хипотеза е невярна. Неговият символ е H 1 или H a.

P-стойността в Excel е число между 0 и 1. Има таблици, програми за електронни таблици и статистически софтуер, които помагат да се изчисли p-стойността. Нивото на значимост (α) е предварително определен праг, определен от изследователя. Обикновено е 0,05. Много малка p-стойност, която е по-малка от нивото на значимост, показва, че отхвърляте нулевата хипотеза. P-стойността, която е по-голяма от нивото на значимост, показва, че не успяваме да отхвърлим нулевата хипотеза.

Обяснение на формулата за P-стойност

Формулата за изчисляване на р-стойността може да бъде получена чрез използване на следните стъпки:

Изчисляване на P-стойността от Z статистика

Стъпка 1: Трябва да открием тестовата статистика z

Z = (p̂ - p0) / √ (p0 (1-p0) / n)

Където

  • p̂ е примерна пропорция
  • p0 е предполагаемо съотношение на населението в нулевата хипотеза
  • n е размерът на извадката

Стъпка 2: Трябва да намерим съответното ниво на p от получената стойност z. За тази цел трябва да разгледаме таблицата z.

Източник: www.dummies.com

Например, нека намерим стойността на p, съответстваща на z ≥ 2,81. Тъй като нормалното разпределение е симетрично, отрицателните стойности на z са равни на неговите положителни стойности. 2,81 е сбор от 2,80 и 0,01. Погледнете 2.8 в колоната z и съответната стойност от 0.01. Получаваме p = 0,0025.

Примери за формула с P-стойност (с шаблон на Excel)

Нека да видим няколко прости до усъвършенствани примера на уравнението P-Value, за да го разберем по-добре.

Пример # 1

а) Р-стойността е 0,3015. Ако нивото на значимост е 5%, намерете дали можем да отхвърлим нулевата хипотеза.

б) P-стойността е 0,0129. Ако нивото на значимост е 5%, намерете дали можем да отхвърлим нулевата хипотеза.

Решение:

Използвайте следните данни за изчисляване на P-стойност.

P-Стойността ще бъде -

а) Тъй като р-стойността от 0,3015 е по-голяма от нивото на значимост от 0,05 (5%), не успяваме да отхвърлим нулевата хипотеза.

б) Тъй като р-стойността от 0,0129 е по-малка от нивото на значимост от 0,05, ние отхвърляме нулевата хипотеза.

Пример # 2

27% от хората в Индия говорят хинди според проучване. Изследовател е любопитен дали цифрата е по-висока в селото му. Следователно, рамкират нулевата и алтернативната хипотеза. Той тества H 0: p = 0,27. Ха : р> 0,27. Тук p е делът на хората в селото, които говорят хинди. Той възлага проучване в селото си, за да установи броя на хората, които могат да говорят хинди. Той открива, че 80 от 240 души, включени в извадката, могат да говорят хинди. Разберете приблизителната р-стойност за теста на изследователя, ако трябва да приемем, че са изпълнени необходимите условия и нивото на значимост е 5%.

Решение:

Използвайте следните данни за изчисляване на P-стойност.

Тук размерът на извадката n = 240,

p 0 е делът на населението. Ще трябва да намерим пропорцията на извадката

= 80/240

= 0,33

Z Статистика

Изчисляване на Z статистика

= 0,33 - 0,27 / √ 0,27 * (1 - 0,27) / 240

Z Статистика ще бъде -

Z = 2.093696

P-Стойността ще бъде -

P-стойност = P (z ≥ 2,09)

Трябва да разгледаме стойността на 2.09 е таблицата z. И така, трябва да разгледаме -2,0 в колоната z и стойността в колоната 0,09. Тъй като нормалното разпределение е симетрично, площта вдясно от кривата е равна на тази вляво. Получаваме р-стойността като 0,0183.

Стойност на P = 0,0183

Тъй като р-стойността е по-малка от значимото ниво от 0,05 (5%), ние отхвърляме нулевата хипотеза.

Забележка: В Excel р-стойността идва като 0,0181

Пример # 3

Проучванията показват, че по-голям брой самолетни билети се купуват от мъже в сравнение с жените. Купуват се от мъже и жени в съотношение 2: 1. Изследването е проведено на определено летище в Индия, за да се установи разпределението на самолетните билети сред мъжете и жените. От 150 билета 88 билета са закупени от мъже и 62 от жени. Трябва да разберем дали експерименталната манипулация причинява промяната в резултатите, или наблюдаваме случайна вариация. Изчислете р-стойността, като приемете, че степента на значимост е 0,05.

Решение:

Използвайте следните данни за изчисляване на P-стойност.

Стъпка 1: Наблюдаваната стойност е 88 за мъже и 62 за жени.

  • Очаквана стойност за мъже = 2/3 * 150 = 100 мъже
  • Очаквана стойност за жени = 1/3 * 150 = 50 жени

Стъпка 2: Разберете хи-квадрат

= ((88-100) 2 ) / 100 + (62-50) 2 /50

= 1,44 + 2,88

Chi-Square (X 2)

Chi-Square (X 2) ще бъде -

Chi-Square (X 2) = 4.32

Стъпка 3: Намерете степента на свобода

Тъй като има 2 променливи - мъже и жени, n = 2

Степени на свобода = n-1 = 2-1 = 1

Стъпка 4: От таблицата p-стойност разглеждаме първия ред в таблицата, тъй като степента на свобода е 1. Можем да видим, че p-стойността е между 0,025 и 0,05. Тъй като р-стойността е по-малка от степента на значимост от 0,05, ние отхвърляме нулевата хипотеза.

P-Стойността ще бъде -

Стойност на P = 0,037666922

Забележка: Excel директно дава р-стойността, използвайки формулата:

CHITEST (действителен диапазон, очакван диапазон)

Пример # 4

Известно е, че 60% от хората, които влизат в магазини за облекло в даден град, купуват нещо. Собственик на магазин за облекло искаше да открие дали броят на магазина за облекло, притежаван от него, е по-голям. Той вече имаше резултатите от проучване, проведено за неговия магазин. 128 от 200 души, влезли в магазина му, са закупили нещо. Собственикът на магазина обозначава pas дела на хората, които влизат в магазина му за облекло и купуват нещо. Поставената от него нулева хипотеза е p = 0,60, а алтернативната хипотеза е p> 0,60. Намерете р-стойността за изследването при ниво на значимост от 5%.

Решение:

Използвайте следните данни за изчисляване на P-стойност.

Тук размерът на извадката n = 200. Ще трябва да намерим пропорцията на извадката

= 128/200

= 0,64

Z Статистика

Изчисляване на Z статистика

= 0,64 - 0,60 / √ 0,60 * (1 - 0,60) / 200

Z Статистика ще бъде -

Z Статистика = 1.1547

Стойност на P = P (z ≥ 1,1547)

Функция NORMSDIST в Excel

NORMSDIST ще бъде -

NORMSDIST = 0.875893461

Има вградена функция за изчисляване на p-стойност от az статистика в Excel. Известна е като функция NORMSDIST. Функцията Excel NORMSDIST изчислява стандартната нормална кумулативна функция на разпределение от предоставена стойност. Форматът му е NORMSDIST (z). Тъй като z статистическата стойност е в клетка B2, използваната функция е = NORMSDIST (B2).

Стойността на P ще бъде -

Стойност на P = 0,12410654

Тъй като трябва да намерим областта вдясно от кривата,

р-стойност = 1 - 0,875893 = 0,124107

Тъй като р-стойността на 0,124107 е повече от значително ниво от 0,05, не успяваме да отхвърлим нулевата хипотеза.

Уместност и употреба

P-Value има широко приложение при тестване на статистически хипотези, по-специално при тестване на нулеви хипотези. Например, управител на фонд управлява взаимен фонд. Той твърди, че възвръщаемостта от дадена схема на взаимния фонд е еквивалентна на Nifty, която е еталонният индекс на фондовия пазар. Той ще формулира нулевата хипотеза, че възвръщаемостта на схемата за взаимен фонд е еквивалентна на тази на Nifty. Алтернативната хипотеза би била, че възвръщаемостта на схемата и възвръщаемостта на Nifty не са еквивалентни. След това ще изчисли р-стойността.

Интересни статии...