Размер на извадката (определение, формула) - Изчислете размера на пробата

Формула за определяне размера на извадката от населението

Формулата за размер на извадката помага при изчисляването или определянето на минималния размер на извадката, който е необходим, за да се знае адекватната или правилна пропорция на популацията, заедно с нивото на доверие и степента на грешка.

Терминът „извадка“ се отнася до частта от популацията, която ни позволява да направим изводи за популацията и затова е важно размерът на извадката да е достатъчно адекватен, за да могат да се правят смислени изводи. С други думи, минималният размер е необходим, за да се оцени истинската пропорция на популацията с необходимата граница на грешка и ниво на доверие. Като такова определянето на подходящия размер на извадката е един от повтарящите се проблеми в статистическия анализ. Неговото уравнение може да бъде изведено чрез използване на размера на популацията, критичната стойност на нормалното разпределение, пропорцията на извадката и допустимата грешка.

Размер на пробата n = N * (Z 2 * p * (1-p) / e 2 ) / (N - 1 + (Z 2 * p * (1-p) / e 2 )

където,

  • N = Население,
  • Z = критична стойност на нормалното разпределение при необходимото ниво на доверие,
  • p = пропорция на пробата,
  • e = Допустима грешка

Как да изчислим размера на извадката? (Стъпка по стъпка)

  • Стъпка 1: Първо, определете размера на популацията, който е общият брой на отделните обекти във вашето население, и той се обозначава с N. (Забележка: В случай че размерът на популацията е много голям, но точният брой не е известен, използвайте 100 000, защото размерът на извадката не се променя много за популации, по-големи от това.)
  • Стъпка 2: След това определете критичната стойност на нормалното разпределение при необходимото ниво на доверие. Например критичната стойност при 95% ниво на доверие е 1,96.
  • Стъпка 3: След това определете пропорцията на извадката, която може да се използва от предишните резултати от проучването или да бъде събрана чрез провеждане на малко пилотно проучване. (Забележка: ако не сте сигурни, винаги можете да използвате 0,5 като консервативен подход и това ще даде възможно най-голям размер на извадката.)
  • Стъпка 4: След това определете граница на грешка, която е диапазонът, в който се очаква да лежи истинската популация. (Забележка: По-малка граница на грешка, повече е прецизността и следователно точният отговор.)
  • Стъпка 5: И накрая, уравнението за размера на извадката може да бъде получено чрез използване на размера на популацията (стъпка 1), критичната стойност на нормалното разпределение при необходимото ниво на доверие (стъпка 2), пропорцията на извадката (стъпка 3) и граница на грешка ( стъпка 4), както е показано по-долу.

Примери

Пример # 1

Нека вземем примера на търговец на дребно, който се интересува да знае колко от клиентите им са закупили артикул от тях, след като са разгледали уебсайта им в определен ден. Като се има предвид, че техният уебсайт има средно 10 000 преглеждания на ден, определят размера на извадката на клиентите, които те трябва да наблюдават при ниво на доверие 95% с 5% грешка, ако:

  • Те не са сигурни за текущия коефициент на конверсия.
  • Те знаят от предишни проучвания, че процентът на конверсия е 5%.

Като се има предвид,

  • Население, N = 10 000
  • Критична стойност при 95% ниво на доверие, Z = 1,96
  • Допустима грешка, e = 5% или 0,05

1 - Тъй като текущият процент на преобразуване е неизвестен, нека приемем p = 0,5

Следователно, размерът на извадката може да бъде изчислен с помощта на формулата като,

= (10 000 * (1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ) / (10000 - 1 + ((1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ))))

Следователно 370 клиенти ще бъдат достатъчни за извеждане на смислено заключение.

2 - Текущият процент на конверсия е p = 5% или 0,05

Следователно, размерът на извадката може да бъде изчислен с помощта на горната формула като,

= (10 000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (10000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Следователно, размер от 72 клиенти ще бъде достатъчен за извеждане на смислено заключение в този случай.

Пример # 2

Нека вземем горния пример и в този случай нека приемем, че размерът на популацията, т.е. ежедневният преглед на уебсайта, е между 100 000 и 120 000, но тогава точната стойност не е известна. Останалите стойности са същите, заедно с коефициент на конверсия от 5%. Изчислете размера на извадката както за 100 000, така и за 120 000.

Като се има предвид,

  • Пропорция на пробата, p = 0,05
  • Критична стойност при 95% ниво на доверие, Z = 1,96
  • Допустима грешка, e = 0,05

Следователно, размерът на извадката за N = 100 000 може да се изчисли като,

= (100000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (100000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Следователно, размерът на извадката за N = 120 000 може да се изчисли като,

= (120000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (120000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Следователно се доказва, че тъй като размерът на популацията се увеличава до много голям, той става без значение при изчисляването на размера на извадката.

Уместност и употреба

Изчисляването на размера на пробата е важно, за да се разбере концепцията за подходящия размер на извадката, тъй като тя се използва за валидността на резултатите от изследването. В случай, че е твърде малък, няма да даде валидни резултати, докато извадката е твърде голяма, може да бъде загуба както на пари, така и на време. Статистически значителният размер на извадката се използва предимно за проучвания на пазарни проучвания, здравни изследвания и образователни проучвания.

Интересни статии...