Pandas является одним из самых популярных инструментов для анализа данных в Python. Эта библиотека с открытым исходным кодом является основой многих проектов данных и используется для очистки данных и манипулирования данными. С пандами вы получаете больший контроль над сложными наборами данных. Это важный инструмент в ремне инструмента анализа данных. Если вы не используете панды, вы не максимально используете свои данные.
В моей другой статье, Панды для Python Tutorial Я прошел через все основы панд, чтобы вы начали. В этом посте я собрал 35 самых важных операций и команд, которые должен знать любой пользователь Pandas. Эта статья предназначена для учащихся Pandas, которые ищут быстрые ответы на поиск. Нет более сложной документации! Давайте поймаем ответы.
Master Python для анализа данных.
Узнайте инструменты торговли: панды, Numpy, Matplotlib и Seaborn
Прогнозирующий анализ данных с Python
- Конвенция о импорте Панды
- Создать и назвать серию
- Создайте DataFrame
- Укажите значения в столбцах DataFrame
- Читать и записать в файл CSV
- Читать и записать в файл Excel
- Читайте и пишите в SQL -запрос
- Получите первый элемент серии
- Получите первые 5 элементов серии
- Получите последние 5 элементов в серии
- Выберите одну позицию значения
- Выберите одно значение по метке
- Доступ к DataFrame с помощью логического индекса
- Сбросить значения из рядов
- Отбросить значения из столбцов
- Создайте новый столбец в DataFrame
- Переименовать столбцы в данных данных
- Серия сортировки по этикеткам вдоль оси
- Сортировки значений вдоль оси (порядок восходящего)
- Добавление рядов к конкретным записям
- Получить строки и столбцы Описание
- Опишите столбцы DataFrame
- Получить описание индекса
- Получите информацию о DataFrame
- Повторно
- Получить сумму значений
- Вычтите/добавьте 2 из всех значений
- Умножьте/разделите все значения на 2
- Найдите значения min/max dataframe
- Получить значения Min/Max Index
- Получить медиана или среднее значения
- Опишите сводку статистики данных
- Применить функцию к набору данных
- Объедините два DataFrames
- Объедините диапазоны данных по столбцам или рядам: конкатенация
- Обернуть и ресурсы
Конвенция о импорте Панды
import pandas as pd
Панды теперь доступны с аббревиатурой ПД
. Вы также можете установить панды, используя встроенный инструмент Python PIP и запустить следующую команду.
$ pip install pandas
Создать и назвать серию
Создайте одномерный массив для хранения любого типа данных. Вызвать ПД Series ()
Метод, а затем передайте список значений. Панды будут индексом подсчета по умолчанию от 0.
series1 = pd.Series([1,2,3,4]), index=['a', 'b', 'c', 'd'])
Установите название серии
srs.name = "Insert name"
Установите имя индекса.
srs.index.name = "Index name"
Создайте DataFrame
Создайте двухмерную структуру данных с столбцами. Создать и распечатать df
Анкет
df = pd.DataFrame( {"a" : [1 ,2, 3], "b" : [7, 8, 9], "c" : [10, 11, 12]}, index = [1, 2, 3])
Укажите значения в столбцах DataFrame
Укажите, как вы хотите организовать свой DataFrame по столбцам.
df = pd.DataFrame( [[1, 2, 3], [4, 6, 8], [10, 11, 12]], index=[1, 2, 3], columns=['a', 'b', 'c'])
Читать и записать в файл CSV
Откройте файл CSV, скопируйте данные, вставьте их в наш блокнот и сохраните его в том же каталоге, в котором находятся ваши сценарии Python. Используйте read_csv
Функция встроена в панды и индексируйте это так, как мы хотим.
import pandas as pd data = pd.read_csv('file.csv') data = pd.read_csv("data.csv", index_col=0)
Читать и записать в файл Excel
Позвоните в read_excel
Функция для доступа к файлу Excel. Передайте имя файла Excel в качестве аргумента.
pd.read_excel('file.xlsx') df.to_excel('dir/myDataFrame.xlsx', sheet_name='Sheet2')
Читайте и пишите в SQL -запрос
from sqlalchemy import create_engine engine = create_engine('sqlite:///:memory:') pd.read_sql("SELECT * FROM my_table;", engine) pd.read_sql_table('my_table', engine) pd.read_sql_query("SELECT * FROM my_table;", engine)
(read_sql ()
– это удобная обертка вокруг read_sql_table ()
и read_sql_query ())
df.to_sql('myDf', engine)
Получите первый элемент серии
Поскольку Pandas индексы на 0, вызовите первый элемент с ser [0]
Анкет
import pandas as pd df = pd.read_csv df['Name'].head(10) # get the first element ser[0]
Получите первые 5 элементов серии
Используйте ser [: n]
Чтобы получить первые элементы серии.
import pandas as pd df = pd.read_csv df['Name'].head(10) ser[:5]
Получите последние 5 элементов в серии
Используйте ser [-n:]
Чтобы получить последние элементы серии.
import pandas as pd df = pd.read_csv df['Name'].head(10) ser[-5:]
Выберите одну позицию значения
df.iloc[[0],[0]] 'Name' df.iat([0],[0]) 'Name'
Выберите одно значение по метке
df.loc[[0], ['Label']] 'Name' df.at([0], ['Label']) 'Name'
Доступ к DataFrame с помощью логического индекса
В логическом индексации мы фильтруют данные с помощью логического вектора.
import pandas as pd # dictionary of lists dict = {'name':["name1", "name2", "name3", "name4"], 'degree': ["degree1", "degree2", "degree3", "degree4"], 'score':[1, 2, 3, 4]} df = pd.DataFrame(dict, index = [True, False, True, False]) print(df)
Сбросить значения из рядов
s.drop(['a', 'c'])
Отбросить значения из столбцов
df.drop('Value', axis=1)
Создайте новый столбец в DataFrame
df['New Column'] = 0
Продолжайте обучение.
Узнайте панды и анализ данных, не пробираясь через видео или документацию. Текстовые курсы Educative просты в скидке и оснащены живыми средами кодирования, что делает обучение быстрым и эффективным.
Прогнозирующий анализ данных с Python
Переименовать столбцы в данных данных
df.columns = ['Column 1', 'Column 2', 'Column 3']
Серия сортировки по этикеткам вдоль оси
Серия сортировки от индексных меток и возвращает новую серию, отсортированную по метке, если аргумент в области – ЛОЖЬ
, в противном случае он обновляет оригинальную серию и возвращает Нет
Анкет
Series.sort_index(self, axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True)
Сортировки значений вдоль оси (порядок восходящего)
df.sort_values(by='Values') # descending order df.sort_values(ascending = False)
Добавление рядов к конкретным записям
Укажите, как вы хотите ранжировать столбец и добавить ряды.
df.rank()
Получить строки и столбцы Описание
df.shape
Опишите столбцы DataFrame
df.columns
Получить описание индекса
df.index
Получите информацию о DataFrame
df.info()
Получить количество значений без НА
df.count()
Получить сумму значений
df.sum() # cumulative sum df.cumsum()
Вычтите/добавьте 2 из всех значений
s.sub(2) s.add(2)
Умножьте/разделите все значения на 2
s.mul(2) s.div(2)
Найдите значения min/max dataframe
df.min() df.max()
Получить значения Min/Max Index
df.idxmin() df.idxmax()
Получить медиана или среднее значения
df.mean() df.median()
Опишите сводку статистики данных
df.describe()
Применить функцию к набору данных
f = # write function here df.apply(f) # apply a function by an element f = # write function here df.applymap(f)
Объедините два DataFrames
pd.merge(df1, df2, on='subject_id')
Объедините диапазоны данных по столбцам или рядам: конкатенация
print(pd.concat([df1, df2]))
Заворачивание и ресурсы
Теперь, когда вы вооружены общими операциями и командами в Python, вы можете применить их на практике. В конце концов, работа с реальными наборами данных – лучший способ освоить Python и стать аналитиком данных! Есть еще гораздо больше, чтобы узнать, что мы не охватили сегодня, например, как,
- Статистика
- Numpy
- Matplotlib
- Усовершенствованные данные о споре
- Визуализация для данных
- Сокращение данных
- Морской
- Scikit
- и более
Чтобы начать работу с этими важными инструментами торговли, ознакомьтесь с курсом образования Анализ прогнозирования данных для Python Анкет Вы получите практическую практику со стандартными отраслевыми примерами и свободно владеете анализом данных.
Продолжай читать
- Анализ данных стал простым: Учебник Python Pandas
- Мастер -алгоритмы с Python для интервью кодирования
- Прекратите использование Excel для анализа данных: обновление до Python
Оригинал: “https://dev.to/educative/pandas-cheat-sheet-top-35-commands-and-operations-bge”