Как получить стандартное отклонение списка Python?

Автор оригинала: Chris.

Эта статья показывает, как рассчитать стандартное отклонение данного списка численных входов в Python.

Стандартное отклонение определяется как Квадратный корень дисперсии Отказ

Если вы посещали свой последний курс статистики несколько лет назад, давайте быстро переправим Определение дисперсии : Это Среднее квадратное отклонение элементов списка от среднего значения.

Итак, как рассчитать стандартное отклонение данного списка в Python?

Импортируйте Numpy Library с Импорт numpy как np и использовать np.std (список) функция.
Импорт статистика библиотека с Статистика импорта а также вызов Статистика .stdev (список) получить немного другой результат, потому что он нормализуется с (N-1), а не N для N для элементов списка – это называется Коррекция Бесселя .
Без внешней зависимости: рассчитать среднее значение как Сумма (список)/len (список) И затем рассчитайте дисперсию в заявлении о понимании списка.

Давайте посмотрим на обоих методах в Python Code:

lst = [1, 0, 1, 2]

# 1. NumPy Standard Deviation
import numpy as np
std = np.std(lst)
print(std)
# 0.7071067811865476

# 2. Statistics Standard Deviation
import statistics
std = statistics.stdev(lst)
print(std)
# 0.816496580927726

# 3. W/O External Dependency
avg = sum(lst) / len(lst)
var = sum((x-avg)**2 for x in lst) / len(lst)
std = var**0.5
print(std)
# 0.7071067811865476

Головоломка : Попробуйте изменить элементы в списке, чтобы стандартное отклонение вариантов (1) и (3) равно 1,0 вместо 0,7071067811865476 в нашей интерактивной оболочке:

1. В первом примере вы создаете список и передаете его как аргумент для np.std (lst) Функция Numpy Bibly. Интересно, что Numpy Library также поддерживает вычисления на базовые типы коллекций, не только на Numpy Armays. Если вам нужно улучшить свои навыки Numpy, Ознакомьтесь с нашим углубленным руководством блога Отказ

2. Во втором примере вы импортируете библиотеку статистики и позвоните в функцию STDEV () Отказ Единственное отличие стандартного отклонения NUMPY состоит в том, что коррекция Bessel применяется: результат делится на (N-1), а не п. Если вам нужен больше фона на этом, нажмите это Wiki Link.

3. В третий пример вы сначала рассчитаете средний как Сумма (список)/len (список) . Затем вы используете выражение генератора (см. Понимание списка ) для динамического генерирования сбора индивидуальных квадратных различий, один из элементов списка, используя выражение (X-AVG) ** 2 Отказ Вы суммируете их и нормализуете количество элементов списка для получения дисперсии.

Это абсолютный минимум, необходимый для расчета базовых статистических данных, таких как стандартное отклонение (и дисперсия) в Python. Но это гораздо больше, и изучение других способов, и альтернативы на самом деле сделают вас лучшим кодировщиком. Итак, давайте погрузимся в некоторые связанные вопросы и темы, которые вы можете узнать!

Стандартное отклонение в Python Pandas

Хотите рассчитать стандартное отклонение столбца в вашем Пандас Dataframe?

Вы можете сделать это, используя pd.std () Функция, которая рассчитывает стандартное отклонение вдоль всех столбцов. Затем вы можете получить столбец, который вы заинтересованы в после вычисления.

import pandas as pd

# Create your Pandas DataFrame
d = {'username': ['Alice', 'Bob', 'Carl'],
     'age': [18, 22, 43],
     'income': [100000, 98000, 111000]}
df = pd.DataFrame(d)

print(df)

Ваше dataframe выглядит так:

	имя пользователя	возраст	доход
0	Алиса	18	100000
1	Боб	22	98000
2	Карьера	43	111000

Вот как вы можете рассчитать стандартное отклонение всех столбцов:

print(df.std())

Вывод является стандартным отклонением всех столбцов:

age         13.428825
income    7000.000000
dtype: float64

Чтобы получить дисперсию отдельного столбца, доступа к нему, используя простую индексацию:

print(df.std()['age'])
# 180.33333333333334

Вместе код выглядит следующим образом. Используйте интерактивную оболочку, чтобы играть с ним!

Стандартное отклонение в Numpy Library

Пакет Python для науки о науке данных Numpy Также имеет отличную статистику функциональность. Вы можете рассчитать все основные статистические данные, такие как средний , медиана, дисперсия и стандартное отклонение на Numpy массивов. Просто импортируйте Numpy Library и используйте np.var (а) Способ расчета среднего значения Numpy Array А Отказ

Вот код:

import numpy as np

a = np.array([1, 2, 3])
print(np.std(a))
# 0.816496580927726

Стандартное отклонение в библиотеке статистики

Стандартное отклонение определяется как отклонение значений данных из среднего ( Wiki ). Он используется для измерения дисперсии набора данных. Вы можете рассчитать стандартное отклонение значений в списке с помощью статистического модуля:

import statistics as s

lst = [1, 0, 4, 3]
print(s.stdev(lst))
# 1.8257418583505538

Альтернатива – использовать Numpy’s np.std (lst) метод.

Список Python Median

Какая медиана списка Python? Формально медиана является «значением, разделенным выше половиной от нижней половины образец данных» ( Wiki ).

Как рассчитать медиану списка Python?

Сортируйте список элементов, используя отсортировано () Встроенная функция в Python.
Рассчитайте индекс среднего элемента (см. Графику), разделив длину списка на 2, используя целочисленное разделение.
Вернуть средний элемент.

Вместе вы можете просто получить медиану, выполнив выражение Средний (доход) [Лен (доход)//2] Отказ

Вот пример конкретного кода:

income = [80000, 90000, 100000, 88000]

average = sum(income) / len(income)
median = sorted(income)[len(income)//2]

print(average)
# 89500.0

print(median)
# 90000.0

Похожие учебники:

Подробное руководство Как сортировать список в Python в этом блоге Отказ

Список Python означает

Среднее значение точно так же, как среднее значение: суммируйте все значения в вашей последовательности и разделите по длине последовательности. Вы можете использовать либо расчет Сумма (список)/len (список) или вы можете импортировать статистика Модуль и звонок Среднее (список) .

Вот оба примера:

lst = [1, 4, 2, 3]

# method 1
average = sum(lst) / len(lst)
print(average)
# 2.5

# method 2
import statistics
print(statistics.mean(lst))
# 2.5

Оба метода эквивалентны. статистика Модуль имеет более интересные вариации Среднее () Метод ( Источник ):

иметь в виду()	Арифметическое среднее («среднее») данных.
Медиана ()	Среднее (среднее значение) данных.
median_low ()	Низкий медиана данных.
median_high ()	Высокий медиана данных.
median_grouped ()	Средний или 50-й процентиль, сгруппированные данные.
Режим()	Режим (самое распространенное значение) дискретных данных.

Они особенно интересны, если у вас есть два средних значения, и вы хотите решить, какой из них взять.

Список Python Min Max

Есть Встроенные функции Python которые рассчитают Минимальный и Максимум данного списка. Мин (список) Метод рассчитывает минимальное значение и Макс (список) Метод рассчитывает максимальное значение в списке.

Вот пример минимальных, максимальных и средних вычислений в списке Python:

import statistics as s

lst = [1, 1, 2, 0]
average = sum(lst) / len(lst)
minimum = min(lst)
maximum = max(lst)

print(average)
# 1.0

print(minimum)
# 0

print(maximum)
# 2

Куда пойти отсюда

Резюме : Как рассчитать стандартное отклонение данного списка в Python?

Импортируйте Numpy Library с помощью Импорт Numpy как NP и использовать np.std (список) функция.
Импорт статистика Библиотека с Статистика импорта и позвонить Статистика .stdev (список) получить немного другой результат, потому что он нормализован с (N-1), а не N для n элементов списка – это называется Коррекция Бесселя Отказ
Без внешней зависимости: рассчитать среднее, как Сумма (список)/len (список) И затем рассчитайте дисперсию в заявлении о понимании списка.

Если вы продолжаете бороться с теми основными командами Python, и вы чувствуете застрявшие в своем прогрессе обучения, у меня есть что-то для вас: Python One-listers (Amazon Link).

В книге я дам вам тщательный обзор темы критических компьютерных наук, таких как машинное обучение, регулярное выражение, наука о данных, Numpy и Python Basics – все в одной линейке кода Python!

Получите книгу от Amazon!

Официальная книга Описание: Python One-Listers покажет читателям, как выполнить полезные задачи с одной строкой кода Python. Следуя краткому переподготовку Python, книга охватывает важные продвинутые темы, такие как нарезка, понимание списка, вещание, функции лямбда, алгоритмы, регулярные выражения, нейронные сети, логистические регрессии и др .. Каждая из 50 секций книг вводит проблему для решения, проходит читателя через навыки, необходимые для решения этой проблемы, затем предоставляет краткое однонаправленное решение Python с подробным объяснением.

Работая в качестве исследователя в распределенных системах, доктор Кристиан Майер нашел свою любовь к учению студентов компьютерных наук.

Чтобы помочь студентам достичь более высоких уровней успеха Python, он основал сайт программирования образования Finxter.com Отказ Он автор популярной книги программирования Python одноклассники (Nostarch 2020), Coauthor of Кофе-брейк Python Серия самооставленных книг, энтузиаста компьютерных наук, Фрилансера и владелец одного из лучших 10 крупнейших Питон блоги по всему миру.

Его страсти пишут, чтение и кодирование. Но его величайшая страсть состоит в том, чтобы служить стремлению кодер через Finxter и помогать им повысить свои навыки. Вы можете присоединиться к его бесплатной академии электронной почты здесь.

Оригинал: “https://blog.finxter.com/how-to-get-the-standard-deviation-of-a-python-list/”