Шпаргалка Pandas: Top 35 команд и операции

Pandas является одним из самых популярных инструментов для анализа данных в Python. Эта библиотека с открытым исходным кодом является основой многих проектов данных и используется для очистки данных и манипулирования данными. С пандами вы получаете больший контроль над сложными наборами данных. Это важный инструмент в ремне инструмента анализа данных. Если вы не используете панды, вы не максимально используете свои данные.

В моей другой статье, Панды для Python Tutorial Я прошел через все основы панд, чтобы вы начали. В этом посте я собрал 35 самых важных операций и команд, которые должен знать любой пользователь Pandas. Эта статья предназначена для учащихся Pandas, которые ищут быстрые ответы на поиск. Нет более сложной документации! Давайте поймаем ответы.

Master Python для анализа данных.

Узнайте инструменты торговли: панды, Numpy, Matplotlib и Seaborn

Прогнозирующий анализ данных с Python

Конвенция о импорте Панды
Создать и назвать серию
Создайте DataFrame
Укажите значения в столбцах DataFrame
Читать и записать в файл CSV
Читать и записать в файл Excel
Читайте и пишите в SQL -запрос
Получите первый элемент серии
Получите первые 5 элементов серии
Получите последние 5 элементов в серии
Выберите одну позицию значения
Выберите одно значение по метке
Доступ к DataFrame с помощью логического индекса
Сбросить значения из рядов
Отбросить значения из столбцов
Создайте новый столбец в DataFrame
Переименовать столбцы в данных данных
Серия сортировки по этикеткам вдоль оси
Сортировки значений вдоль оси (порядок восходящего)
Добавление рядов к конкретным записям
Получить строки и столбцы Описание
Опишите столбцы DataFrame
Получить описание индекса
Получите информацию о DataFrame
Повторно
Получить сумму значений
Вычтите/добавьте 2 из всех значений
Умножьте/разделите все значения на 2
Найдите значения min/max dataframe
Получить значения Min/Max Index
Получить медиана или среднее значения
Опишите сводку статистики данных
Применить функцию к набору данных
Объедините два DataFrames
Объедините диапазоны данных по столбцам или рядам: конкатенация
Обернуть и ресурсы

Конвенция о импорте Панды

import pandas as pd

Панды теперь доступны с аббревиатурой ПД . Вы также можете установить панды, используя встроенный инструмент Python PIP и запустить следующую команду.

$ pip install pandas

Создать и назвать серию

Создайте одномерный массив для хранения любого типа данных. Вызвать ПД Series () Метод, а затем передайте список значений. Панды будут индексом подсчета по умолчанию от 0.

series1 = pd.Series([1,2,3,4]), index=['a', 'b', 'c', 'd'])

Установите название серии

srs.name = "Insert name"

Установите имя индекса.

srs.index.name = "Index name"

Создайте DataFrame

Создайте двухмерную структуру данных с столбцами. Создать и распечатать df Анкет

df = pd.DataFrame(
         {"a" : [1 ,2, 3],
          "b" : [7, 8, 9],
          "c" : [10, 11, 12]},        index = [1, 2, 3])

Укажите значения в столбцах DataFrame

Укажите, как вы хотите организовать свой DataFrame по столбцам.

df = pd.DataFrame( 
     [[1, 2, 3], 
     [4, 6, 8],
     [10, 11, 12]],
     index=[1, 2, 3], 
     columns=['a', 'b', 'c'])

Читать и записать в файл CSV

Откройте файл CSV, скопируйте данные, вставьте их в наш блокнот и сохраните его в том же каталоге, в котором находятся ваши сценарии Python. Используйте read_csv Функция встроена в панды и индексируйте это так, как мы хотим.

import pandas as pd
data = pd.read_csv('file.csv')

data = pd.read_csv("data.csv", index_col=0)

Читать и записать в файл Excel

Позвоните в read_excel Функция для доступа к файлу Excel. Передайте имя файла Excel в качестве аргумента.

pd.read_excel('file.xlsx')

df.to_excel('dir/myDataFrame.xlsx',  sheet_name='Sheet2')

Читайте и пишите в SQL -запрос

from sqlalchemy import create_engine
engine = create_engine('sqlite:///:memory:')
pd.read_sql("SELECT * FROM my_table;", engine)
pd.read_sql_table('my_table', engine)
pd.read_sql_query("SELECT * FROM my_table;", engine)

(read_sql () – это удобная обертка вокруг read_sql_table () и read_sql_query ())

df.to_sql('myDf', engine)

Получите первый элемент серии

Поскольку Pandas индексы на 0, вызовите первый элемент с ser [0] Анкет

import pandas as pd  

df = pd.read_csv  

df['Name'].head(10) 

# get the first element 
ser[0]

Получите первые 5 элементов серии

Используйте ser [: n] Чтобы получить первые элементы серии.

import pandas as pd  

df = pd.read_csv  

df['Name'].head(10) 

ser[:5]

Получите последние 5 элементов в серии

Используйте ser [-n:] Чтобы получить последние элементы серии.

import pandas as pd  

df = pd.read_csv 

df['Name'].head(10) 

ser[-5:]

Выберите одну позицию значения

df.iloc[[0],[0]] 'Name'
df.iat([0],[0]) 'Name'

Выберите одно значение по метке

df.loc[[0], ['Label']] 'Name'
df.at([0], ['Label']) 'Name'

Доступ к DataFrame с помощью логического индекса

В логическом индексации мы фильтруют данные с помощью логического вектора.

import pandas as pd 

# dictionary of lists 
dict = {'name':["name1", "name2", "name3", "name4"], 
        'degree': ["degree1", "degree2", "degree3", "degree4"], 
        'score':[1, 2, 3, 4]} 

df = pd.DataFrame(dict, index = [True, False, True, False]) 

print(df)

Сбросить значения из рядов

s.drop(['a', 'c'])

Отбросить значения из столбцов

df.drop('Value', axis=1)

Создайте новый столбец в DataFrame

df['New Column'] = 0

Продолжайте обучение.

Узнайте панды и анализ данных, не пробираясь через видео или документацию. Текстовые курсы Educative просты в скидке и оснащены живыми средами кодирования, что делает обучение быстрым и эффективным.

Прогнозирующий анализ данных с Python

Переименовать столбцы в данных данных

df.columns = ['Column 1', 'Column 2', 'Column 3']

Серия сортировки по этикеткам вдоль оси

Серия сортировки от индексных меток и возвращает новую серию, отсортированную по метке, если аргумент в области – ЛОЖЬ , в противном случае он обновляет оригинальную серию и возвращает Нет Анкет

Series.sort_index(self, axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True)

Сортировки значений вдоль оси (порядок восходящего)

df.sort_values(by='Values')

# descending order
df.sort_values(ascending = False)

Добавление рядов к конкретным записям

Укажите, как вы хотите ранжировать столбец и добавить ряды.

df.rank()

Получить строки и столбцы Описание

df.shape

Опишите столбцы DataFrame

df.columns

Получить описание индекса

df.index

Получите информацию о DataFrame

df.info()

Получить количество значений без НА

df.count()

Получить сумму значений

df.sum()

# cumulative sum

df.cumsum()

Вычтите/добавьте 2 из всех значений

s.sub(2)

s.add(2)

Умножьте/разделите все значения на 2

s.mul(2)

s.div(2)

Найдите значения min/max dataframe

df.min()

df.max()

Получить значения Min/Max Index

df.idxmin()

df.idxmax()

Получить медиана или среднее значения

df.mean()

df.median()

Опишите сводку статистики данных

df.describe()

Применить функцию к набору данных

f = # write function here
df.apply(f)

# apply a function by an element 

f = # write function here
df.applymap(f)

Объедините два DataFrames

pd.merge(df1, df2, on='subject_id')

Объедините диапазоны данных по столбцам или рядам: конкатенация

print(pd.concat([df1, df2]))

Заворачивание и ресурсы

Теперь, когда вы вооружены общими операциями и командами в Python, вы можете применить их на практике. В конце концов, работа с реальными наборами данных – лучший способ освоить Python и стать аналитиком данных! Есть еще гораздо больше, чтобы узнать, что мы не охватили сегодня, например, как,

Статистика
Numpy
Matplotlib
Усовершенствованные данные о споре
Визуализация для данных
Сокращение данных
Морской
Scikit
и более

Чтобы начать работу с этими важными инструментами торговли, ознакомьтесь с курсом образования Анализ прогнозирования данных для Python Анкет Вы получите практическую практику со стандартными отраслевыми примерами и свободно владеете анализом данных.

Продолжай читать

Оригинал: “https://dev.to/educative/pandas-cheat-sheet-top-35-commands-and-operations-bge”