Рубрики
Без рубрики

Как рассчитать среднее значение списка – статистика и средняя функция Python объяснена подробно

Автор оригинала: Armstrong Subero.

Математика и программирование идут рука об руку. Если вы программист, в какой-то момент вам придется использовать математику.

Наука данных, машинное обучение, искусственный интеллект и криптовалюты основаны на сложных основных математических принципах.

Однако использование математических функций не должно быть сложным! Питон абстрагирует все, поэтому, как только вы понимаете концепции, вам не нужно будет понимать полную информацию о реализации.

Математика не должна быть страшной

Есть много математических функций, которые вы столкнетесь. Если вы работаете с данными или аналитикой, важно, чтобы вы понимаете некоторые математические принципы и функции.

Одна такая функция, которую вы должны понимать, это Среднее функция.

Не откладывайте имя – ничего не значит (каламбур) о Среднее Функция в Python.

Этот пост является самим собой, но я ожидаю, что у вас есть опыт работы с Python, и что вы знаете, что такое список Python. Если нет, проверьте эту статью, прежде чем двигаться дальше.

Как только вы закончите, вернитесь и присоединяйтесь к мне на глубокий погружение в Среднее функция.

Статистика

Так что вы хотите узнать о Среднее функция. Замечательно! Но прежде чем мы посмотрим на эту функцию, важно посмотреть на дисциплину, из которой она возникает: статистика.

На изображении выше мы видим график. График – это изобразительное представление, которое показывает взаимосвязь одной переменной по отношению к другой.

Графики полезны, потому что они позволяют нам организовать данные, чтобы мы могли быстро увидеть тенденции и отношения между данными. График – это только один инструмент, который мы можем использовать для визуализации и анализа данных.

Статистика – это филиал математики, которая позволяет нам иметь систематический способ классификации, анализа и интерпретации данных. Это важно, потому что с статистикой у нас есть коллекция готовых инструментов для выполнения каждой из этих вещей.

Представьте, что если вам нужно перенести увильку каждый раз, когда вам нужно порезать кусок дерева. Мы бы многие люди называли пилами разными именами, хотя они делают то же самое. Чтобы избежать этой проблемы, мы дали увиденное имя, которое каждый может ссылаться на него.

То же самое происходит в статистике – у нас есть инструменты хорошо известные инструменты, с которыми все знакомы. Один такой инструмент является средним.

Режим, медиана и средний

Хотя среднее значение идеально способно стоять самостоятельно, он обычно преподается как часть трио, который включает в себя режим, медиана и средний.

Давайте посмотрим на группу чисел, чтобы вы поймете, что здесь происходит. Представьте, что у вас есть цифры ниже:

1, 2, 3, 3, 4, 6, 9

Скажем, мы хотели выразить, какой номер встречается больше всего раз. Это было бы 3, а имя, которое мы даем это свойство, это режим. Режим – это номер, который является наиболее частым в наборе, который мы изучаем.

Номер в середине упорядоченного набора называется медианом. Чтобы найти медиану численного набора, организовать номера от наименьшего в крупнейшее и посмотреть на номер в середине. Набор чисел выше, уже устроен из наименьшего для наибольшего, поэтому средний номер также 3.

Наконец, среднее значение является еще одним способом обращения к среднему уровню набора. Чтобы найти среднее, просто добавьте все номера вместе и разделите его по общему количеству элементов в наборе. В случае числа выше, если мы добавим их все вместе, мы получаем 28. Общее количество элементов в наборе 7, поэтому наше среднее значение 4.

Почему мы нуждаемся в среднем?

Таким образом, на данный момент вам может быть интересно, почему нам нужно найти среднее значение в любом случае.

Дело в том, что даже сама статистика подразделяется на несколько групп. Точно так же, как у вас есть инструменты, которые используются для работы с деревом и другими для работы с металлом, некоторые инструменты в статистике сгруппированы в классы, поскольку они используются для аналогичной цели.

Одной из таких групп в статистике называется сводная статистика. Используется одна из вещей статистики для того, чтобы описать данные, а сводную статистику – это набор инструментов, используемых для этой цели. Один из предметов в этом классе инструментов является среднее значение.

Среднее значение важно из-за того, что помогают нам проанализировать то, что известно как распределение. В статистике распределение – это метод, который мы используем, чтобы посмотреть на переменную, мы нужна информация о. Использование распределения мы рассмотрим значения этой переменной и как часто это происходит.

Если мы собираем данные, общий тип распределения, который мы видим, является нормальным распространением, которое принимает форму кривой колоколов:

То есть переменная будет иметь общее значение, на котором она имеет тенденцию, а также начальную точку и конечную точку.

То, что означает, что он позволяет нам принимать такое распределение, и посмотрите на центральную тенденцию переменной, которая является точкой, на которой значения переменной имеют тенденцию к кластеру.

Таким образом, мы можем сказать, что среднее описано центральная тенденция распределения.

Расчет среднего в Python

Мы можем вручную рассчитать среднее значение, если у нас есть небольшие численные данные, на которые у нас есть несколько ценностей для работы. Однако, когда у нас есть сотни или тысячи ценностей в наборе данных, становится невозможным рассчитать его вручную.

Поскольку Python – это «батареи включены» язык, то, как мы можем сделать это, это использовать Среднее Функция модуля статистики в Python.

Давайте использовать Среднее Функция для расчета среднего значения численного набора данных мы имели ранее в посте:

# 1. import the statistics module
import statistics

# 2. list containing our numerical data set
numerical_data_set = [1, 2, 3, 3, 4, 6, 9]

# 3. calculate the mean
calc_mean = statistics.mean(numerical_data_set)

# 4. print our calculated mean
print("Mean is: ", calc_mean)

Наш код состоит из 4 шаговой последовательности, которую мы можем использовать для расчета среднего:

  1. Мы импортируем модуль статистики, который содержит нашу среднюю функцию
  2. Мы создаем список Python, содержащий численный набор данных, которые мы хотели бы рассчитать среднее значение
  3. Мы рассчитываем среднее и хранить результат в переменной, Calc_Mean
  4. Мы выводим наш рассчитанный среднее значение, чтобы мы могли получить визуальную обратную связь

Когда мы запускаем код, мы получим следующий вывод:

Программа выводит одинаковое значение, что и наши ручные расчеты. Когда мы работаем с большим набором данных, эта функция сможет масштабировать, чтобы справиться с тем, что мы можем бросить на него.

Обертывание

В этом посте мы посмотрели на Среднее Функция в Python. Мы начали с обсуждения статистики в целом, затем глубоко погрузились в средну.

Теперь, когда у вас есть солидное понимание статистики и Среднее Функция в Python, вы можете использовать его в своих собственных программах.

Если вам понравилась эта статья, то вам также может быть любопытно узнать о структурах и алгоритмах данных. Если вы хотите простую, понятное, пошаговое руководство по изучению структур данных и алгоритмов данных без необходимости написания одной строки кода, вы можете проверить книгу бездневых структур данных и алгоритмы.

Читайте книгу здесь: