Как да изчислим средната стойност на списък - подробно обяснена статистика и средната функция на Python

Математиката и програмирането вървят ръка за ръка. Ако сте програмист, в един момент ще трябва да използвате математика.

Науката за данните, машинното обучение, изкуственият интелект и криптовалутите се основават на сложни основни математически принципи.

Използването на математически функции обаче не трябва да е сложно! Python абстрахира всичко, така че след като разберете концепциите, няма да е необходимо да разбирате пълните подробности за изпълнението.

Математиката не трябва да бъде страшна

Има много математически функции, с които ще се сблъскате. Ако работите с данни или анализи, важно е да разберете някои математически принципи и функции.

Една такава функция, която трябва да разберете, е meanфункцията.

Не се смущавайте от името - няма нищо лошо (предназначено за игра на думи) във meanфункцията в Python.

Тази публикация е самостоятелна, но предполагам, че имате известен опит в работата с Python и че знаете какво е списък на Python. Ако не, разгледайте тази статия, преди да продължите напред.

След като приключите, върнете се и се присъединете към мен за дълбоко потапяне във meanфункцията.

Статистика

Така че искате да научите за meanфункцията. Това е страхотно! Но преди да разгледаме тази функция е важно да разгледаме дисциплината, от която произхожда: статистиката.

На изображението по-горе виждаме графика. Графиката е изобразително представяне, което показва връзката на една променлива спрямо друга.

Графиките са полезни, защото ни позволяват да организираме данни, така че да можем бързо да видим тенденциите и връзките между данните. Графиката е само един инструмент, който можем да използваме за визуализиране и анализ на данни.

Статистиката е клон на математиката, който ни позволява да имаме систематичен начин за класифициране, анализ и интерпретация на данните. Това е важно, тъй като със статистическите данни имаме колекция от готови инструменти за извършване на всяко едно от тези неща.

Представете си, ако трябва да преоткривате трион всеки път, когато трябва да отрежете парче дърво. Много хора биха нарекли триони с различни имена, въпреки че те правят едно и също нещо. За да избегнем този проблем, дадохме име на триона, с който всеки може да се позове на него.

Същото се случва и в статистиката - имаме добре познати инструменти, с които всеки е запознат. Един такъв инструмент е средното.

Режим, медиана и средна стойност

Въпреки че средната стойност е напълно способна да стои самостоятелно, обикновено се преподава като част от трио, което включва режим, медиана и средно.

Нека разгледаме група от числа, за да разберете какво се случва тук. Представете си, че имате цифрите по-долу:

1, 2, 3, 3, 4, 6, 9

Да кажем, че искаме да изразим кое число се среща най-много пъти. Би било 3 и името, което даваме на това свойство, е режим. Режимът е числото, което е най-често в дадения набор, който изследваме.

Числото в средата на подреден набор се нарича медиана. За да намерите медианата на числовия набор, подредете числата от най-малките до най-големите и след това погледнете числото в средата. Наборът от числа по-горе вече е подреден от най-малкото до най-голямото, така че средното число също е 3.

И накрая, средната стойност е друг начин да се отнесе към средната стойност на набора. За да намерите средната стойност, просто добавете всички числа заедно и ги разделете на общия брой елементи в набора. В случая на числата по-горе, ако ги съберем всички заедно, получаваме 28. Общият брой елементи в набора е 7, така че средната ни стойност е 4.

Защо се нуждаем от средното?

Така че в този момент може би се чудите защо така или иначе трябва да намерим средното за числото.

Работата е там, че дори самата статистика е разделена на няколко групи. Точно както имате инструменти, които се използват за работа с дърво и други за работа с метал, някои инструменти в статистиката са групирани в класове, тъй като се използват за подобна цел.

Една такава група в статистиката се нарича обобщена статистика. Едно от нещата, за които се използва статистиката, е да описва данни, а обобщената статистика е колекция от инструменти, използвани за тази цел. Един от елементите в този клас инструменти е средното.

Средната стойност е важна, защото ни помага да анализираме това, което е известно като разпределение. В статистиката разпределението е метод, който използваме, за да разгледаме променлива, за която искаме информация. Използвайки разпределение, ще разгледаме стойностите на тази променлива и колко често се среща.

Ако събираме данни, често срещан тип разпространение, което виждаме, е нормалното разпределение, което приема формата на камбанна крива:

Тоест променливата ще има обща стойност, към която се стреми, както и начална и крайна точка.

Това, което означава средното, е, че ни позволява да вземем такова разпределение и да разгледаме централната тенденция на променливата, която е точката, в която стойностите на променливата са склонни да се групират.

По този начин можем да кажем, че средната стойност описва централната тенденция на разпределението.

Изчисляване на средното в Python

Можем ръчно да изчислим средната стойност, ако имаме малък набор от цифрови данни, имаме няколко стойности, с които да работим. Когато обаче имаме стотици или хиляди стойности в набор от данни, става невъзможно да се изчисли на ръка.

Тъй като Python е език с включени батерии, начинът, по който можем да го направим, е да използваме meanфункцията на модула за статистика в Python.

Нека използваме meanфункцията, за да изчислим средната стойност на числовия набор от данни, който имахме по-рано в публикацията:

 # 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean) 

Our code consists of a 4 step sequence that we can use to calculate the mean:

  1. We import the statistics module that contains our mean function
  2. We create a Python list containing the numerical data set of which we would like to calculate the mean
  3. We calculate the mean and store the result in a variable, calc_mean
  4. We output our calculated mean so that we can get visual feedback

When we run the code, we will get the following output:

The program outputs the same value as our manual calculations. When we are working with large data sets, this function will be able to scale to handle whatever we can throw at it.

Wrapping Up

In this post we looked at the mean function in Python. We began by discussing statistics as a whole, then took a deep dive into mean.

Now that you have a solid understanding of statistics and the mean function in Python, you can use it in your own programs.

If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.

Read the book here:

Безкодови структури от данни и алгоритми - Научете DSA, без да пишете един ред код | Армстронг Суберо | Apress Тази книга ви предлага нова перспектива за алгоритмите и структурите на данни, напълно безплатна. Научете за алгоритмите за структура на данните (DSA), без никога да се налага да отваряте редактора на кода, да използвате компилатор или да разглеждате интегрирана среда за разработка (IDE) .... Armstrong Subero Search Menu Cart V Количката ви в момента е празна. Вход Акаунт Вход за лавица Apress Access