Разпределение на честотата в статистиката (определение) - Формула за изчисление

Съдържание

Какво е разпределението на честотата в статистиката?

Какво е разпределението на честотата в статистиката?

Разпределението на честотата, функция в статистиката, се използва за отразяване на различните резултати от определена честота под формата на таблица и / или графика, показваща колко пъти се е появила конкретна стойност в група или интервал.

За да изчислим честотата в Excel, трябва да приложим формулата за разпределение на честотата в клетката, където искаме да се отрази резултатът.

= Честота (data_array, bins_array)

Данни: За изразяване на информация, независимо дали е цифрова или нечислова, ако се събира заедно, е известна като данни. Например имената на учениците и оценките, отбелязани от тях.
Масив от данни: Това е групата от числова или нечислова информация, необходима за разпределение на честотата. Като цяло това е група данни, достъпни за разглеждане.
Bins Array: Това е интервалът, създаден за групиране на данните за необходимите честоти. Например, ако искаме да направим множество честоти за оценките, отбелязани от учениците, това може да бъде 0-09, 10-20, 21-30 и т.н.

Обяснение

Според формулата за разпределение на честотата получаваме представа за броя на определена честота (група или число) в суровия набор от данни. Тъй като групата данни не предоставя ползотворна информация, честотното разпределение добавя стойност към нея чрез разделяне на данните на дадени честоти или групи. От наблюдението на горната таблица е видно, че има само едно домакинство, което няма паркинг. Освен това, почти всички къщи разполагат с поне три паркоместа.

Примери за честотно разпределение

Пример # 1

Да вземем пример, за да задълбочим разбирането на формулата за разпределение на честотата. В местния квартал на Санта Клара, Калифорния, всеки дом има множество съоръжения за паркиране на автомобили. По-долу са посочени броят на слотовете във всяка къща за паркиране на автомобили.

Решение:

Стъпки за създаване на честотно разпределение в статистиката:

На първо място, ще изчислим броя на интервалите. Интервалите тук са една кола, две коли, три коли и т.н.
Сега ще създадем таблица с две колони; броя на данните за паркиране на автомобили и честотата на тези интервали. Заглавието на колоната ще бъде Налични паркинги и Честота.
Сега ще използваме честотната формула на Excel, като въведем = знак в клетката, където се нуждаем от резултати, т.е. клетки от колоната Честота. Ще поставим = честота и ще въведем раздел (той автоматично ще избере формулата за честота от падащия списък) и ще изберем суровите данни като масив от данни (A4: A23). След това ще поставим запетая (,), след което ще продължим напред, за да изберем всички данни от интервали (C4: C9), създадени от нас в частта за масив bins. Сега ще поставим затварящата скоба (скоби) или просто ще натиснем enter. Формулата е пълна и ще видим резултата, показан в клетката.

Формулата ще изглежда така.

= ЧЕСТОТА (A4: A23, C4: C9)

Но показаният резултат не е точен, тъй като в статистическите формули, където масивът се използва при изчислението, резултатът има тенденция да се отклонява от точността. Така че, ние ще използваме къдравите скоби (), за да разрешим този проблем. Фигурната скоба помага на формулата да получи точни резултати.

(= ЧЕСТОТА (A4: A23, C4: C9))

Ще отидем до първата клетка, където първоначално сме поставили формулата, и натискаме F2, последвано от Ctrl + Shift + Enter. Сега полученият отговор е пълен.

Пример # 2

Нека изчислим честотата на оценките, получени от учениците по предмета „Наука“.

Таблицата на оценките, получени от учениците, е както следва:

Решение:

За да изчислим честотното разпределение на групата, трябва да следваме следните стъпки:

На първо място, трябва да създадем три колони; От, до и честота. Тук, от и до, ще вземем най-високото до най-ниското число въз основа на набора от данни. Взехме най-ниското число като нула, а най-високото като 99 за изчисляване на честотното разпределение.
На второ място, ще вземем най-високите числа като интервали в следващата колона.
Ще поставим честотната формула Честота (data_array, bins_array). Тук масивът от данни е от B4: B23, а масивът за кошчета е F4: F13. Тази формула се поставя в клетката, където се нуждаем от резултата, и избира масив от данни и масив от контейнери, като избира получените марки и интервалите.

Сега ще приложим къдравите скоби, като използваме F2, Ctrl + Shift + Enter. Сега имаме необходимите резултати. След като сложите цялата формула, тя ще изглежда така:

(= ЧЕСТОТА (B4: B23, F4: F13))

Така че честотното разпределение осигурява по-информативен подход към суровите данни. Тук той показва честотата на различните оценки, отбелязани от различни ученици в класа. Например 11 ученици са получили оценки между 50 - 70.

Пример # 3

Нека изчислим честотата на автомобилите, произведени от различни марки по целия свят.

Решение:

На първо място, ще поставим най-високите и най-ниските данни в колоните От и До, получени от колоната Произведени автомобили в примера.
След това ще присвоим числата в честотната таблица в низходящ ред. Сега ще приложим формулата за честота, спомената по-горе в къдравите скоби. Ще поставим честотната формула Честота (data_array, bins_array).
Тук масивът от данни е от B4: B15, а масивът за кошчета е F4: F12. Тази формула се поставя в клетката, където се нуждаем от резултата, и избира масив от данни и масив от контейнери, като избира получените марки и интервалите. Сега ще приложим къдравите скоби, като използваме F2, Ctrl + Shift + Enter. Сега имаме необходимите резултати.

След като сложите цялата формула, тя ще изглежда така:

(= ЧЕСТОТА (B4: B15, F4: F12))

Получихме резултатите от различни честоти в колоната Честота, показващи броя на компаниите, участващи в производството на автомобили за тази конкретна категория.

След като спазихме горната таблица, бихме могли да направим груба оценка на обхвата на производство на автомобили от различни марки. Като таблицата показва, че продуктовата гама от 10 - 19 е изпълнена от трима производители на автомобили.

Уместност и употреба

Това е метод за разбиране на информацията, съдържаща се в предоставените необработени данни. Обяснява колко пъти дадено число или наблюдение идва в набора от една информация.
Помага ни да намерим модел в дадения набор от данни. Например, ако вземем първия пример, бихме могли лесно да заключим, че почти всички домакинства разполагат със съоръжение за паркиране на автомобили, тъй като има само една къща, в която няма паркинг.