Рубрики
Без рубрики

Как переименовать столбец Pandas DataFrame в Python

В этом уроке мы рассмотрим, как переименовать столбец фрейма данных Pandas в Python. Мы рассмотрим функцию rename (), а также создание нового фрейма данных.

Автор оригинала: Hassan Saeed.

Вступление

Pandas – это библиотека Python для анализа и манипулирования данными. Почти все операции в pandas вращаются вокруг Фрейма данных s.

A Data frame is-это абстрактное представление двумерной таблицы, которая может содержать все виды данных. Они также позволяют нам давать имена всем столбцам, поэтому часто столбцы называются атрибутами или полями при использовании DataFrames .

В этой статье мы увидим, как мы можем переименовать уже существующие столбцы DataFrame .

Существует два варианта манипулирования именами столбцов фрейма данных :

  1. Переименование столбцов существующего фрейма данных
  2. Назначение пользовательских имен столбцов при создании нового фрейма данных

Давайте рассмотрим оба метода.

Переименование столбцов существующего фрейма данных

У нас есть образец DataFrame ниже:

import pandas as pd
data = {'Name':['John', 'Doe', 'Paul'], 
        'age':[22, 31, 15]} 
df = pd.DataFrame(data)

Фрейм данных |/df выглядит следующим образом:

оригинальный фрейм данных pandas

Чтобы переименовать столбцы этого DataFrame , мы можем использовать метод rename () , который принимает:

  1. Словарь в качестве аргумента columns , содержащий сопоставление исходных имен столбцов с новыми именами столбцов в виде пар ключ-значение
  2. A логическое значение в качестве аргумента inplace , который, если установлен в True внесет изменения в исходный Фрейм данных

Давайте изменим имена столбцов в нашем Фрейме данных с Name, age на First Name, Age .

df.rename(columns = {'Name' : 'First Name', 'age' : 'Age'}, inplace = True)

Теперь наш df содержит:

pandas dataframe переименовать столбец

Назначение имен столбцов При создании фрейма данных

Теперь мы обсудим, как назначать имена столбцов при создании DataFrame .

Это особенно полезно, когда вы создаете DataFrame из файла csv и хотите игнорировать имена столбцов заголовка и назначать свои собственные.

Передавая список в аргумент names , мы можем переопределить уже существующий столбец заголовка своим собственным. Список должен иметь имя для каждого столбца данных, в противном случае возникает исключение.

Обратите внимание, что если мы хотим переименовать только несколько столбцов, то лучше использовать метод rename для фрейма данных после его создания.

Мы создадим DataFrame с помощью out.csv , который имеет следующее содержимое:

Name, age
John, 22
Doe, 31
Paul, 15

Обратите внимание, что первая строка в файле является строкой заголовка и содержит имена столбцов. Pandas по умолчанию присваивает имена столбцов Фрейму данных из первой строки.

Следовательно, мы будем указывать игнорировать строку заголовка при создании вашего фрейма данных и указывать имена столбцов в списке, который передается в аргумент names :

columns = ['First Name', 'Age']
df = pd.read_csv('out.csv', header = None, names = columns)
df

Это приводит к:

новый фрейм данных измененные имена столбцов

Другой способ сделать это-указать имена столбцов в простом старом конструкторе DataFrame () .

Единственное отличие состоит в том, что теперь параметр, принимающий список имен столбцов, называется column вместо names :

import numpy as np

new_columns = ['First Name', 'Age']
data = np.array([["Nicholas", 23],["Scott", 32],["David", 25]])

df = pd.DataFrame(data, columns = new_columns)

Это приводит к другому фрейму данных :

конструктор dataframe переименовать столбец

Вывод

В этой статье мы быстро рассмотрели, как мы можем называть и переименовывать столбцы в DataFrame s. Либо назначая имена при построении экземпляра DataFrame , либо переименовывая их после факта с помощью метода rename () .