Как создать dataframe в пандах?

Автор оригинала: Lukas.

В модуле Python Python DataFrames являются двумерными объектами данных. Вы можете думать о них как о столах со строками и столбцами, которые содержат данные. В этой статье представлена обзор наиболее распространенных способов инстанции данных DataFrames. Мы следуем Конвенции, чтобы переименовать импорт Pandas в PD.

Создайте DataFrame из файла CSV

Создание данных данных с функцией pd.read_csv (имя файла) вероятно, самый известный. Первая строка файла CSV содержит метки столбцов, разделенные запятыми. В следующих строках следуйте точкам данных, в каждой строке, как многие, как есть столбцы. Точки данных должны быть разделены запятыми, если вы хотите использовать настройки по умолчанию pd.read_csv () Отказ Вот пример такого файла CSV:

# data.csv

column1, column2, column3
value00, value01, value02
value10, value11, value12
value20, value21, value22

Следующий фрагмент кода создает dataframe из файла data.csv:

import pandas as pd

df = pd.read_csv('data.csv')

Функция pd.read_table () Похоже, но ожидает вкладки как разделители вместо COMA. Поведение Pandas по умолчанию добавляет индекс целочисленного строки, но также можно выбрать один из столбцов данных, чтобы стать столбец индекса. Для этого используйте параметр index_col Отказ Пример: pd.read_csv (‘data.csv’,)

Создайте DataFrame из списка списков

DataFrame может быть создан из списка списков, где каждый список во внешнем списке содержит данные для одной строки. Чтобы создать DataFrame, мы используем конструктор DataFrame, к которому мы проходим список списка и списка с метками столбцов:

import pandas as pd

data = [
     ['Bob', 23],
     ['Carl', 34],
     ['Dan', 14]
]
df = pd.DataFrame(data, columns=['Name', 'Age'])

Создайте dataframe из словаря списков

DataFrame может быть создан из словаря списков. Ключи словаря являются метками столбцов, списки содержат данные для столбцов.

import pandas as pd

# columns
names = ['Alice', 'Bob', 'Carl']
ages = [21, 27, 35]

# create the dictionary of lists
data = {'Name':names, 'Age':ages}

df = pd.DataFrame(data)

Создайте dataframe из списка словарей

DataFrame может быть создан из списка словарей. Каждый словарь представляет строку в DataFrame. Клавиши в словарях – это метки столбца, а значения являются значениями для столбцов.

data = [
         {'Car':'Mercedes', 'Driver':'Hamilton, Lewis'},
         {'Car':'Ferrari', 'Driver':'Schumacher, Michael'},
         {'Car':'Lamborghini', 'Driver':'Rossi, Semino'}
]

Создайте dataframe из списка кортежей

Конструктор DataFrame также можно назвать со списком кортежей, где каждый кортеж представляет собой строку в DataFrame. Кроме того, мы передаем список меток столбца к параметру Колонны Отказ

import pandas as pd

names = ['Alice', 'Bob', 'Clarisse', 'Dagobert']
ages = [20, 53, 42, 23]

# create a list of tuples
data = list(zip(names, ages))

df = pd.DataFrame(data, columns=['Name', 'Age'])

Суммирование

В этой статье мы прошли диапазон различных способов создания данных данных в Пандах. Однако это не исчерпывающе. Вы должны выбрать метод, который лучше всего подходит для вашего использования, это означает, что метод, который требует наименьшего количества преобразования данных.