Рубрики
Без рубрики

Как рассчитать столбец Стандартное отклонение данных DataFrame в Python Pandas?

Хотите рассчитать стандартное отклонение столбца в ваших PandaSaframe? В случае, если вы посещали свой последний курс статистического тера в несколько лет назад, давайте быстро откроем определение дисперсии: это среднее квадратное отклонение элементов списка из среднего значения. Вы можете сделать это с помощью функции PD.Std (), которая … Как рассчитать стандартное отклонение стандартного столбца в Python Pandas? Подробнее “

Автор оригинала: Chris.

Хотите рассчитать стандартное отклонение столбца в вашем Пандас Dataframe?

Если вы посещали свой последний курс статистики несколько лет назад, давайте быстро переправим Определение дисперсии : Это Среднее квадратное отклонение элементов списка от среднего значения.

Вы можете сделать это, используя pd.std () Функция, которая рассчитывает стандартное отклонение вдоль всех столбцов. Затем вы можете получить столбец, который вы заинтересованы в после вычисления.

import pandas as pd

# Create your Pandas DataFrame
d = {'username': ['Alice', 'Bob', 'Carl'],
     'age': [18, 22, 43],
     'income': [100000, 98000, 111000]}
df = pd.DataFrame(d)

print(df)

Ваше dataframe выглядит так:

имя пользователя возраст доход
0 Алиса 18 100000
1 Боб 22 98000
2 Карьера 43 111000

Вот как вы можете рассчитать стандартное отклонение всех столбцов:

print(df.std())

Вывод является стандартным отклонением всех столбцов:

age         13.428825
income    7000.000000
dtype: float64

Чтобы получить дисперсию отдельного столбца, доступа к нему, используя простую индексацию:

print(df.std()['age'])
# 180.33333333333334

Вместе код выглядит следующим образом. Используйте интерактивную оболочку, чтобы играть с ним!

Стандартное отклонение в Numpy Library

Пакет Python для науки о науке данных Numpy Также имеет отличную статистику функциональность. Вы можете рассчитать все основные статистические данные, такие как средний , медиана, дисперсия и стандартное отклонение на Numpy массивов. Просто импортируйте Numpy Library и используйте np.var (а) Способ расчета среднего значения Numpy Array А Отказ

Вот код:

import numpy as np

a = np.array([1, 2, 3])
print(np.std(a))
# 0.816496580927726

Куда пойти отсюда?

Прежде чем вы сможете стать мастером науки о данных, вам сначала нужно освоить Python. Присоединяйтесь к моим бесплатным курсу электронной почты Python и получите ежедневный урок Python прямо в вашем почтовом ящике. Это весело!

Присоединяйтесь к академии Neail в мире # 1 Python Academy [+ Бесплатные чит-листы как PDF]

Работая в качестве исследователя в распределенных системах, доктор Кристиан Майер нашел свою любовь к учению студентов компьютерных наук.

Чтобы помочь студентам достичь более высоких уровней успеха Python, он основал сайт программирования образования Finxter.com Отказ Он автор популярной книги программирования Python одноклассники (Nostarch 2020), Coauthor of Кофе-брейк Python Серия самооставленных книг, энтузиаста компьютерных наук, Фрилансера и владелец одного из лучших 10 крупнейших Питон блоги по всему миру.

Его страсти пишут, чтение и кодирование. Но его величайшая страсть состоит в том, чтобы служить стремлению кодер через Finxter и помогать им повысить свои навыки. Вы можете присоединиться к его бесплатной академии электронной почты здесь.

Оригинал: “https://blog.finxter.com/how-to-calculate-the-column-standard-deviation-of-a-dataframe-in-python-pandas/”