Автор оригинала: Chris.
Хотите рассчитать стандартное отклонение столбца в вашем Пандас Dataframe?
Если вы посещали свой последний курс статистики несколько лет назад, давайте быстро переправим Определение дисперсии : Это Среднее квадратное отклонение элементов списка от среднего значения.
Вы можете сделать это, используя pd.std () Функция, которая рассчитывает стандартное отклонение вдоль всех столбцов. Затем вы можете получить столбец, который вы заинтересованы в после вычисления.
import pandas as pd # Create your Pandas DataFrame d = {'username': ['Alice', 'Bob', 'Carl'], 'age': [18, 22, 43], 'income': [100000, 98000, 111000]} df = pd.DataFrame(d) print(df)
Ваше dataframe выглядит так:
имя пользователя | возраст | доход | |
0 | Алиса | 18 | 100000 |
1 | Боб | 22 | 98000 |
2 | Карьера | 43 | 111000 |
Вот как вы можете рассчитать стандартное отклонение всех столбцов:
print(df.std())
Вывод является стандартным отклонением всех столбцов:
age 13.428825 income 7000.000000 dtype: float64
Чтобы получить дисперсию отдельного столбца, доступа к нему, используя простую индексацию:
print(df.std()['age']) # 180.33333333333334
Вместе код выглядит следующим образом. Используйте интерактивную оболочку, чтобы играть с ним!
Стандартное отклонение в Numpy Library
Пакет Python для науки о науке данных Numpy Также имеет отличную статистику функциональность. Вы можете рассчитать все основные статистические данные, такие как средний , медиана, дисперсия и стандартное отклонение на Numpy массивов. Просто импортируйте Numpy Library и используйте np.var (а)
Способ расчета среднего значения Numpy Array А
Отказ
Вот код:
import numpy as np a = np.array([1, 2, 3]) print(np.std(a)) # 0.816496580927726
Куда пойти отсюда?
Прежде чем вы сможете стать мастером науки о данных, вам сначала нужно освоить Python. Присоединяйтесь к моим бесплатным курсу электронной почты Python и получите ежедневный урок Python прямо в вашем почтовом ящике. Это весело!
Присоединяйтесь к академии Neail в мире # 1 Python Academy [+ Бесплатные чит-листы как PDF]
Работая в качестве исследователя в распределенных системах, доктор Кристиан Майер нашел свою любовь к учению студентов компьютерных наук.
Чтобы помочь студентам достичь более высоких уровней успеха Python, он основал сайт программирования образования Finxter.com Отказ Он автор популярной книги программирования Python одноклассники (Nostarch 2020), Coauthor of Кофе-брейк Python Серия самооставленных книг, энтузиаста компьютерных наук, Фрилансера и владелец одного из лучших 10 крупнейших Питон блоги по всему миру.
Его страсти пишут, чтение и кодирование. Но его величайшая страсть состоит в том, чтобы служить стремлению кодер через Finxter и помогать им повысить свои навыки. Вы можете присоединиться к его бесплатной академии электронной почты здесь.
Оригинал: “https://blog.finxter.com/how-to-calculate-the-column-standard-deviation-of-a-dataframe-in-python-pandas/”