В модуле Python Python DataFrames являются двумерными объектами данных. Вы можете думать о них как о столах со строками и столбцами, которые содержат данные. В этой статье представлена обзор наиболее распространенных способов инстанции данных DataFrames. Мы следуем Конвенции, чтобы переименовать импорт Pandas в PD.
Создайте DataFrame из файла CSV
Создание данных данных с функцией pd.read_csv (имя файла) вероятно, самый известный. Первая строка файла CSV содержит метки столбцов, разделенные запятыми. В следующих строках следуйте точкам данных, в каждой строке, как многие, как есть столбцы. Точки данных должны быть разделены запятыми, если вы хотите использовать настройки по умолчанию pd.read_csv () Отказ Вот пример такого файла CSV:
# data.csv column1, column2, column3 value00, value01, value02 value10, value11, value12 value20, value21, value22
Следующий фрагмент кода создает dataframe из файла data.csv:
import pandas as pd df = pd.read_csv('data.csv')
Функция pd.read_table () Похоже, но ожидает вкладки как разделители вместо COMA. Поведение Pandas по умолчанию добавляет индекс целочисленного строки, но также можно выбрать один из столбцов данных, чтобы стать столбец индекса. Для этого используйте параметр index_col Отказ Пример: pd.read_csv (‘data.csv’,)
Создайте DataFrame из списка списков
DataFrame может быть создан из списка списков, где каждый список во внешнем списке содержит данные для одной строки. Чтобы создать DataFrame, мы используем конструктор DataFrame, к которому мы проходим список списка и списка с метками столбцов:
import pandas as pd data = [ ['Bob', 23], ['Carl', 34], ['Dan', 14] ] df = pd.DataFrame(data, columns=['Name', 'Age'])
Создайте dataframe из словаря списков
DataFrame может быть создан из словаря списков. Ключи словаря являются метками столбцов, списки содержат данные для столбцов.
import pandas as pd # columns names = ['Alice', 'Bob', 'Carl'] ages = [21, 27, 35] # create the dictionary of lists data = {'Name':names, 'Age':ages} df = pd.DataFrame(data)
Создайте dataframe из списка словарей
DataFrame может быть создан из списка словарей. Каждый словарь представляет строку в DataFrame. Клавиши в словарях – это метки столбца, а значения являются значениями для столбцов.
data = [ {'Car':'Mercedes', 'Driver':'Hamilton, Lewis'}, {'Car':'Ferrari', 'Driver':'Schumacher, Michael'}, {'Car':'Lamborghini', 'Driver':'Rossi, Semino'} ]
Создайте dataframe из списка кортежей
Конструктор DataFrame также можно назвать со списком кортежей, где каждый кортеж представляет собой строку в DataFrame. Кроме того, мы передаем список меток столбца к параметру Колонны Отказ
import pandas as pd names = ['Alice', 'Bob', 'Clarisse', 'Dagobert'] ages = [20, 53, 42, 23] # create a list of tuples data = list(zip(names, ages)) df = pd.DataFrame(data, columns=['Name', 'Age'])
Суммирование
В этой статье мы прошли диапазон различных способов создания данных данных в Пандах. Однако это не исчерпывающе. Вы должны выбрать метод, который лучше всего подходит для вашего использования, это означает, что метод, который требует наименьшего количества преобразования данных.