Автор оригинала: Hassan Saeed.
Вступление
Pandas – это библиотека Python для анализа и манипулирования данными. Почти все операции в pandas
вращаются вокруг Фрейма данных
s.
A Data frame
is-это абстрактное представление двумерной таблицы, которая может содержать все виды данных. Они также позволяют нам давать имена всем столбцам, поэтому часто столбцы называются атрибутами или полями при использовании DataFrames
.
В этой статье мы увидим, как мы можем переименовать уже существующие столбцы DataFrame
.
Существует два варианта манипулирования именами столбцов фрейма данных :
- Переименование столбцов существующего
фрейма данных
- Назначение пользовательских имен столбцов при создании нового фрейма данных
Давайте рассмотрим оба метода.
Переименование столбцов существующего фрейма данных
У нас есть образец DataFrame
ниже:
import pandas as pd data = {'Name':['John', 'Doe', 'Paul'], 'age':[22, 31, 15]} df = pd.DataFrame(data)
Фрейм данных |/df
выглядит следующим образом:
Чтобы переименовать столбцы этого DataFrame
, мы можем использовать метод rename ()
, который принимает:
- Словарь в качестве аргумента
columns
, содержащий сопоставление исходных имен столбцов с новыми именами столбцов в виде пар ключ-значение - A
логическое
значение в качестве аргументаinplace
, который, если установлен вTrue
внесет изменения в исходныйФрейм данных
Давайте изменим имена столбцов в нашем Фрейме данных
с Name, age
на First Name, Age
.
df.rename(columns = {'Name' : 'First Name', 'age' : 'Age'}, inplace = True)
Теперь наш df
содержит:
Назначение имен столбцов При создании фрейма данных
Теперь мы обсудим, как назначать имена столбцов при создании DataFrame
.
Это особенно полезно, когда вы создаете DataFrame
из файла csv
и хотите игнорировать имена столбцов заголовка и назначать свои собственные.
Передавая список в аргумент names
, мы можем переопределить уже существующий столбец заголовка своим собственным. Список должен иметь имя для каждого столбца данных, в противном случае возникает исключение.
Обратите внимание, что если мы хотим переименовать только несколько столбцов, то лучше использовать метод rename
для фрейма данных после его создания.
Мы создадим DataFrame
с помощью out.csv
, который имеет следующее содержимое:
Name, age John, 22 Doe, 31 Paul, 15
Обратите внимание, что первая строка в файле является строкой заголовка и содержит имена столбцов. Pandas по умолчанию присваивает имена столбцов Фрейму данных
из первой строки.
Следовательно, мы будем указывать игнорировать строку заголовка при создании вашего фрейма данных и указывать имена столбцов в списке, который передается в аргумент
names :
columns = ['First Name', 'Age'] df = pd.read_csv('out.csv', header = None, names = columns) df
Это приводит к:
Другой способ сделать это-указать имена столбцов в простом старом конструкторе DataFrame ()
.
Единственное отличие состоит в том, что теперь параметр, принимающий список имен столбцов, называется column
вместо names
:
import numpy as np new_columns = ['First Name', 'Age'] data = np.array([["Nicholas", 23],["Scott", 32],["David", 25]]) df = pd.DataFrame(data, columns = new_columns)
Это приводит к другому фрейму данных
:
Вывод
В этой статье мы быстро рассмотрели, как мы можем называть и переименовывать столбцы в DataFrame
s. Либо назначая имена при построении экземпляра DataFrame
, либо переименовывая их после факта с помощью метода rename ()
.