Правило 68-95-99 - Нормално разпределение, обяснено на обикновен английски

Запознайте се с Мейсън. Той е средностатистически американец на 40 години: 5 фута 10 инча висок и печели 47 000 долара годишно преди данъци.

Колко често бихте очаквали да срещнете някой, който печели 10 пъти повече от Мейсън?

И сега, колко често бихте очаквали да срещнете някой, който е 10 пъти по-висок от Мейсън?

Вашите отговори на двата въпроса по-горе са различни, тъй като разпределението на данните е различно. В някои случаи често е 10 пъти над средното. Докато при други това изобщо не е често срещано.

И така, какви са нормалните дистрибуции?

Днес се интересуваме от нормални дистрибуции. Те са представени от камбанна крива: те имат връх в средата, който се стеснява към всеки ръб. Много неща следват това разпределение, като ръст, тегло и коефициент на интелигентност.

Това разпределение е вълнуващо, защото е симетрично - което улеснява работата с него. Можете да намалите много сложни математики до няколко основни правила, защото не е нужно да се притеснявате за странни случаи на ръба.

Например пикът винаги разделя разпределението наполовина. Има еднаква маса преди и след пика.

Друго важно свойство е, че не се нуждаем от много информация, за да опишем нормално разпределение.

Всъщност имаме нужда само от две неща:

  1. Средното. Повечето хора просто наричат ​​това „средното“. Това е, което получавате, ако съберете стойността на всичките си наблюдения, след което разделите това число на броя на наблюденията. Например средната стойност на тези три числа:1, 2, 3 = (1 + 2 + 3) / 3 = 2
  2. И стандартното отклонение. Това ви казва колко рядко би било наблюдение. Повечето наблюдения попадат в едно стандартно отклонение на средната стойност. По-малко наблюдения са две стандартни отклонения от средната стойност. И още по-малко са три стандартни отклонения (или по-нататък).

Заедно средното и стандартното отклонение съставляват всичко, което трябва да знаете за разпределението.

Правилото 68-95-99

Правилото 68-95-99 се основава на средното и стандартното отклонение. Казва:

68% от населението е в рамките на 1 стандартно отклонение от средната стойност.

95% от населението е в рамките на 2 стандартни отклонения от средната стойност.

99,7% от населението е в рамките на 3 стандартни отклонения от средната стойност.

Как да изчислим нормалните разпределения

За да продължим нашия пример, средният ръст на американския мъж е 5 фута 10 инча, със стандартно отклонение от 4 инча. Това означава:

Сега за забавната част: Нека приложим това, което току-що научихме.

Какъв е шансът да видите някой с височина между 5 фута 10 инча и 6 фута 2 инча? (Тоест между 70 и 74 инча.)

Това е 34%! Използваме двете свойства: разпределението е симетрично, което означава, че шансовете за (66-70) инча и (70-74) инча са 68/2 = 34%.

Нека опитаме по-строг. Какъв е шансът да видите някой с височина между 62 и 66 инча?

Това е (95-68) / 2 = 13,5%. И двата външни ръба имат еднакви%.

И сега вашият последен (и най-труден тест): Какъв е шансът да видите някой с височина по-голяма от 82 инча?

Тук използваме и крайното свойство: всичко трябва да се сумира до 100%. Така че външните ръбове (т.е. височини под 58 и височини над 82) заедно правят (100% - 99,7%) = 0,3%.

Не забравяйте, че можете да приложите това при всяко нормално разпространение. Опитайте да направите същото за женските височини: средното е 65 инча, а стандартното отклонение е 3,5 инча.

И така, шансът да видите някой с височина между 65 и 68,5 инча ще бъде: ___.

...

...

34%! Това е точно същото като нашия първи пример. Това е +1 стандартно отклонение.

Заключение

Познаването на това правило улеснява много калибрирането на сетивата ви. Тъй като всичко, което трябва да опишем всяко нормално разпределение, е средното и стандартното отклонение, това правило важи за всяко нормално разпределение в света!

Предизвикателната част наистина е да разберем дали разпределението е нормално или не.

Искате ли да научите повече за калибриране на сетивата и критично мислене? Вижте теоремата на Байес: Рамка за критично мислене.