Автор оригинала: Pankaj Kumar.
Здравствуйте, читатели! В этой статье мы будем сосредоточиться на Математические функции Python Pandas , в деталях.
Итак, давайте начнем !! 🙂.
Модуль Python Pandas – быстрый обзор
Python предлагает нам различные модули для решения и манипулирования данными в соответствии с требованиями.
Один из таких модулей – модуль Python Pandas.
Модуль PandaS – одна из самых эффективных библиотеки для анализа данных и моделирования. Он предлагает нам с помощью DataFrame и структурой данных серии для хранения и манипулирования данными в виде строк и столбцов. Кроме того, он состоит из различных функций для очистки и обработки данных для моделирования.
На аналогичных строках, когда дело доходит до анализа данных и моделирования, мы наткнулись на необходимость, чтобы иметь математические функции для умеренных данных.
Давайте посмотрим на список каких-то крутых и легких математических функций, предлагаемых модулем Python Pandas.
Функции математики Pandas
В контексте этой темы мы будем сосредоточиться на математических функциях ниже, предлагаемых модулем Pandas-
- Описать () Функция
- Функция value_counts ()
- Среднее () и медианы () функции
- Сумма () Функция
- Мин () и max () функции
Мы будем использовать этот набор данных в предстоящих примерах.
Импорт вышеуказанного набора данных в среду Python::
import pandas as pd data = pd.read_csv("C:\\Users\\Downloads\\datasets_180_408_data.csv") # dataset
1. Pandas Опишите () Функция
С Python Pandas описывает функцию () функцию, мы можем легко получить статистическую информацию о наборе данных относительно следующих параметров
- Количество стоимости
- иметь в виду
- посредственность
- Минимальный предел данных
- Максимальный предел данных
- Интерквартирный диапазон
- стандартное отклонение , так далее
Таким образом, если мы хотим иметь статистический анализ данных Handy, опишите функцию (), является лучшим выбором для нас.
Пример-
print(data.describe())
Выход-
id radius_mean texture_mean perimeter_mean area_mean \ count 1.900000e+01 19.000000 19.000000 19.000000 19.000000 mean 4.049257e+07 16.081053 20.498947 106.725789 829.931579 std 4.293723e+07 2.942387 3.997922 19.297775 305.009648 min 8.423020e+05 11.420000 10.380000 77.580000 386.100000 25% 8.453085e+05 13.720000 18.935000 91.900000 578.100000 50% 8.490140e+05 15.850000 20.830000 103.600000 782.700000 75% 8.447960e+07 18.710000 22.925000 126.400000 1081.500000 max 8.486200e+07 20.570000 27.540000 135.100000 1326.000000 smoothness_mean compactness_mean concavity_mean count 19.000000 19.000000 19.000000 mean 0.107596 0.164038 0.158438 std 0.016457 0.068554 0.067645 min 0.082060 0.066690 0.032990 25% 0.097250 0.105850 0.099460 50% 0.109600 0.159900 0.163900 75% 0.118500 0.215750 0.202250 max 0.142500 0.283900 0.300100
2. Функция суммы ()
Как мы все знаем, модуль PandaS имеет дело с данными в виде строк и столбцов, таким образом, чтобы получить общее значение каждой функции столбца, сумма ().
С помощью функции SUM () мы можем получить числовое суммирование каждого столбца данных, представленного в набор данных.
Пример-
print(data.sum())
Выход-
id 769358823 diagnosis MMMMMBMMBMBBMBMMBBB radius_mean 305.54 texture_mean 389.48 perimeter_mean 2027.79 area_mean 15768.7 smoothness_mean 2.04432 compactness_mean 3.11673 concavity_mean 3.01032 dtype: object
3. Среднее () и медиана () функция ()
Одним из важных статистических условий для анализа является среднее и медиана.
Итак, с модулем PandaS мы можем использовать средние () и медианы () функции, чтобы получить среднее значение, а также среднюю ценность каждого отдельного столбца данных легко.
Пример-
print(data.mean()) print(data.median())
Выход-
id 4.049257e+07 radius_mean 1.608105e+01 texture_mean 2.049895e+01 perimeter_mean 1.067258e+02 area_mean 8.299316e+02 smoothness_mean 1.075958e-01 compactness_mean 1.640384e-01 concavity_mean 1.584379e-01 dtype: float64 id 849014.0000 radius_mean 15.8500 texture_mean 20.8300 perimeter_mean 103.6000 area_mean 782.7000 smoothness_mean 0.1096 compactness_mean 0.1599 concavity_mean 0.1639 dtype: float64
4. Функция min () и max ()
- Пандас Мин () Функция Позволяет нам иметь минимальный предел значений для каждого столбца Handy DataSet.
- С max () Функция Все максимальное значение для каждой отдельной столбцы отображается.
Пример-
print(data.min()) print(data.max())
Выход-
id 842302 diagnosis B radius_mean 11.42 texture_mean 10.38 perimeter_mean 77.58 area_mean 386.1 smoothness_mean 0.08206 compactness_mean 0.06669 concavity_mean 0.03299 dtype: object id 84862001 diagnosis M radius_mean 20.57 texture_mean 27.54 perimeter_mean 135.1 area_mean 1326 smoothness_mean 0.1425 compactness_mean 0.2839 concavity_mean 0.3001 dtype: object
5. Функция Pandas Value_Counts ()
В области науки и анализа данных, когда мы имеем дело с переменными данных, особенно категорическими типом переменных, очень необходимо понимать разную тенденцию в этом типе переменной.
То есть в каждой категорической переменной важно определить тип категории/группы в нем.
С помощью функции Value_Counts () мы можем легко подсчитать тип категории или частоту значений в каждой переменной/столбце данных, которые мы передаем к функции.
Пример-
В приведенном ниже примере мы рассчитали частоту каждого элемента данных колонны RADIUS_MEAN , как показано ниже-
print(data.radius_mean.value_counts())
Выход-
19.81 1 16.02 1 18.25 1 13.00 1 12.46 1 17.99 1 20.57 1 14.68 1 14.54 1 16.13 1 15.78 1 13.71 1 15.85 1 11.42 1 20.29 1 12.45 1 13.73 1 19.17 1 19.69 1
Заключение
С этим мы подошли к концу этой темы. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом.
Для получения дополнительных таких постов, связанных с программированием Python, оставайся настроенными нами!
До этого, счастливого обучения !! 🙂.