Автор оригинала: Python Examples.
Python Pandas – Среднее значение dataframe
Чтобы рассчитать среднее значение Pandas DataFrame, вы можете использовать метод pandas.dataframe.mean (). Использование среднего () метода, вы можете рассчитать среднее по оси, или полное dataframe.
Пример 1: Среднее вдоль столбцов DataFrame
В этом примере мы рассчитаем среднее значение вдоль столбцов. Мы узнаем средние оценки, полученные студентами, субъект мудрым.
Python Program
import pandas as pd mydictionary = {'names': ['Somu', 'Kiku', 'Amol', 'Lini'], 'physics': [68, 74, 77, 78], 'chemistry': [84, 56, 73, 69], 'algebra': [78, 88, 82, 87]} # create dataframe df_marks = pd.DataFrame(mydictionary) print('DataFrame\n----------') print(df_marks) # calculate mean mean = df_marks.mean() print('\nMean\n------') print(mean)
Выход
DataFrame ---------- names physics chemistry algebra 0 Somu 68 84 78 1 Kiku 74 56 88 2 Amol 77 73 82 3 Lini 78 69 87 Mean ------ physics 74.25 chemistry 70.50 algebra 83.75 dtype: float64
Средняя () функция возвращает серию Panda. Это поведение по умолчанию средней функции (). Следовательно, для этого конкретного случая вам не нужно передавать никаких аргументов средней () функции. Или, если вы хотите явно упомянуть в среднем () функции, рассчитать вдоль столбцов, пройти Ось = 0
как показано ниже.
df_marks.mean(axis=0)
Пример 2: Среднее значение dataframe
В этом примере мы создадим DataFrame с номерами, присутствующими во всех столбцах, и рассчитать среднее значение полного DataFrame.
Из предыдущего примера мы видели эту среднюю () функцию по умолчанию, возвращает среднее значение, рассчитанное среди столбцов и возврата серии Panda. Применить среднее значение () на возвращенные ряды и среднее значение для полного DataFrame возвращается.
Python Program
import pandas as pd mydictionary = {'names': ['Somu', 'Kiku', 'Amol', 'Lini'], 'physics': [68, 74, 77, 78], 'chemistry': [84, 56, 73, 69], 'algebra': [78, 88, 82, 87]} # create dataframe df_marks = pd.DataFrame(mydictionary) print('DataFrame\n----------') print(df_marks) # calculate mean of the whole DataFrame mean = df_marks.mean().mean() print('\nMean\n------') print(mean)
Выход
DataFrame ---------- names physics chemistry algebra 0 Somu 68 84 78 1 Kiku 74 56 88 2 Amol 77 73 82 3 Lini 78 69 87 Mean ------ 76.16666666666667
Пример 3: Среднее значение dataframe вдоль рядов
В этом примере мы рассчитаем среднее значение всех столбцов вдоль рядов или ось = 1
Отказ В этом конкретном примере среднее значение вдоль рядов дает среднее или процент отметки, полученных каждым студентом.
Python Program
import pandas as pd mydictionary = {'names': ['Somu', 'Kiku', 'Amol', 'Lini'], 'physics': [68, 74, 77, 78], 'chemistry': [84, 56, 73, 69], 'algebra': [78, 88, 82, 87]} # create dataframe df_marks = pd.DataFrame(mydictionary) print('DataFrame\n----------') print(df_marks) # calculate mean along rows mean = df_marks.mean(axis=1) print('\nMean\n------') print(mean) # display names and average marks print('\nAverage marks or percentage for each student') print(pd.concat([df_marks['names'], mean], axis=1))
Выход
DataFrame ---------- names physics chemistry algebra 0 Somu 68 84 78 1 Kiku 74 56 88 2 Amol 77 73 82 3 Lini 78 69 87 Mean ------ 0 76.666667 1 72.666667 2 77.333333 3 78.000000 dtype: float64 Average marks or percentage for each student names 0 0 Somu 76.666667 1 Kiku 72.666667 2 Amol 77.333333 3 Lini 78.000000
Резюме
В этом уроке Pandas мы узнали, как рассчитать среднее значение Valaframe, среднее значение DataFrame вдоль столбцов (ы) и среднего значения DataFrame вдоль рядов.