Рубрики
Без рубрики

Python Pandas Математические функции, чтобы знать!

Здравствуйте, читатели! В этой статье мы будем сосредоточиться на математических функциях Python Pandas, подробно. Итак, давайте начнем !! 🙂 Модуль Python Pandas – быстро

Автор оригинала: Pankaj Kumar.

Здравствуйте, читатели! В этой статье мы будем сосредоточиться на Математические функции Python Pandas , в деталях.

Итак, давайте начнем !! 🙂.

Модуль Python Pandas – быстрый обзор

Python предлагает нам различные модули для решения и манипулирования данными в соответствии с требованиями.

Один из таких модулей – модуль Python Pandas.

Модуль PandaS – одна из самых эффективных библиотеки для анализа данных и моделирования. Он предлагает нам с помощью DataFrame и структурой данных серии для хранения и манипулирования данными в виде строк и столбцов. Кроме того, он состоит из различных функций для очистки и обработки данных для моделирования.

На аналогичных строках, когда дело доходит до анализа данных и моделирования, мы наткнулись на необходимость, чтобы иметь математические функции для умеренных данных.

Давайте посмотрим на список каких-то крутых и легких математических функций, предлагаемых модулем Python Pandas.

Функции математики Pandas

В контексте этой темы мы будем сосредоточиться на математических функциях ниже, предлагаемых модулем Pandas-

  • Описать () Функция
  • Функция value_counts ()
  • Среднее () и медианы () функции
  • Сумма () Функция
  • Мин () и max () функции

Мы будем использовать этот набор данных в предстоящих примерах.

Импорт вышеуказанного набора данных в среду Python::

import pandas as pd
data = pd.read_csv("C:\\Users\\Downloads\\datasets_180_408_data.csv") # dataset

1. Pandas Опишите () Функция

С Python Pandas описывает функцию () функцию, мы можем легко получить статистическую информацию о наборе данных относительно следующих параметров

  • Количество стоимости
  • иметь в виду
  • посредственность
  • Минимальный предел данных
  • Максимальный предел данных
  • Интерквартирный диапазон
  • стандартное отклонение , так далее

Таким образом, если мы хотим иметь статистический анализ данных Handy, опишите функцию (), является лучшим выбором для нас.

Пример-

print(data.describe())

Выход-

                 id  radius_mean  texture_mean  perimeter_mean    area_mean  \
count  1.900000e+01    19.000000     19.000000       19.000000    19.000000   
mean   4.049257e+07    16.081053     20.498947      106.725789   829.931579   
std    4.293723e+07     2.942387      3.997922       19.297775   305.009648   
min    8.423020e+05    11.420000     10.380000       77.580000   386.100000   
25%    8.453085e+05    13.720000     18.935000       91.900000   578.100000   
50%    8.490140e+05    15.850000     20.830000      103.600000   782.700000   
75%    8.447960e+07    18.710000     22.925000      126.400000  1081.500000   
max    8.486200e+07    20.570000     27.540000      135.100000  1326.000000   

       smoothness_mean  compactness_mean  concavity_mean  
count        19.000000         19.000000       19.000000  
mean          0.107596          0.164038        0.158438  
std           0.016457          0.068554        0.067645  
min           0.082060          0.066690        0.032990  
25%           0.097250          0.105850        0.099460  
50%           0.109600          0.159900        0.163900  
75%           0.118500          0.215750        0.202250  
max           0.142500          0.283900        0.300100  

2. Функция суммы ()

Как мы все знаем, модуль PandaS имеет дело с данными в виде строк и столбцов, таким образом, чтобы получить общее значение каждой функции столбца, сумма ().

С помощью функции SUM () мы можем получить числовое суммирование каждого столбца данных, представленного в набор данных.

Пример-

print(data.sum())

Выход-

id                            769358823
diagnosis           MMMMMBMMBMBBMBMMBBB
radius_mean                      305.54
texture_mean                     389.48
perimeter_mean                  2027.79
area_mean                       15768.7
smoothness_mean                 2.04432
compactness_mean                3.11673
concavity_mean                  3.01032
dtype: object

3. Среднее () и медиана () функция ()

Одним из важных статистических условий для анализа является среднее и медиана.

Итак, с модулем PandaS мы можем использовать средние () и медианы () функции, чтобы получить среднее значение, а также среднюю ценность каждого отдельного столбца данных легко.

Пример-

print(data.mean())
print(data.median())

Выход-

id                  4.049257e+07
radius_mean         1.608105e+01
texture_mean        2.049895e+01
perimeter_mean      1.067258e+02
area_mean           8.299316e+02
smoothness_mean     1.075958e-01
compactness_mean    1.640384e-01
concavity_mean      1.584379e-01
dtype: float64

id                  849014.0000
radius_mean             15.8500
texture_mean            20.8300
perimeter_mean         103.6000
area_mean              782.7000
smoothness_mean          0.1096
compactness_mean         0.1599
concavity_mean           0.1639
dtype: float64

4. Функция min () и max ()

  1. Пандас Мин () Функция Позволяет нам иметь минимальный предел значений для каждого столбца Handy DataSet.
  2. С max () Функция Все максимальное значение для каждой отдельной столбцы отображается.

Пример-

print(data.min())
print(data.max())

Выход-

id                   842302
diagnosis                 B
radius_mean           11.42
texture_mean          10.38
perimeter_mean        77.58
area_mean             386.1
smoothness_mean     0.08206
compactness_mean    0.06669
concavity_mean      0.03299
dtype: object

id                  84862001
diagnosis                  M
radius_mean            20.57
texture_mean           27.54
perimeter_mean         135.1
area_mean               1326
smoothness_mean       0.1425
compactness_mean      0.2839
concavity_mean        0.3001
dtype: object

5. Функция Pandas Value_Counts ()

В области науки и анализа данных, когда мы имеем дело с переменными данных, особенно категорическими типом переменных, очень необходимо понимать разную тенденцию в этом типе переменной.

То есть в каждой категорической переменной важно определить тип категории/группы в нем.

С помощью функции Value_Counts () мы можем легко подсчитать тип категории или частоту значений в каждой переменной/столбце данных, которые мы передаем к функции.

Пример-

В приведенном ниже примере мы рассчитали частоту каждого элемента данных колонны RADIUS_MEAN , как показано ниже-

print(data.radius_mean.value_counts())

Выход-

19.81    1
16.02    1
18.25    1
13.00    1
12.46    1
17.99    1
20.57    1
14.68    1
14.54    1
16.13    1
15.78    1
13.71    1
15.85    1
11.42    1
20.29    1
12.45    1
13.73    1
19.17    1
19.69    1

Заключение

С этим мы подошли к концу этой темы. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом.

Для получения дополнительных таких постов, связанных с программированием Python, оставайся настроенными нами!

До этого, счастливого обучения !! 🙂.