Автор оригинала: Pankaj Kumar.
Мы можем использовать функцию Panda Module Read_Excel () для чтения данных файла Excel в объект DataFrame.
Если вы посмотрите на лист Excel, это двумерная таблица. Объект DataFrame также представляет собой двумерную структуру табличных данных.
1. Pandas Read_Excel () Пример
Допустим, у нас есть файл Excel с двумя листами – сотрудниками и автомобилями. Верхний ряд содержит заголовок таблицы.
Excel файловые листы данных
Вот пример, чтобы прочитать данные листа «Сотрудники» и печатают его.
import pandas excel_data_df = pandas.read_excel('records.xlsx', sheet_name='Employees') # print whole sheet data print(excel_data_df)
Выход:
EmpID EmpName EmpRole 0 1 Pankaj CEO 1 2 David Lee Editor 2 3 Lisa Ray Author
- Первый параметр – это имя файла Excel.
- Параметр SETT_NAME определяет лист, который будет прочитан из файла Excel.
- Когда мы распечатаем объект dataframe, вывод – это двумерная таблица. Это выглядит похоже на записи листов Excel.
2. Список столбцов заголовки листа Excel
Мы можем получить список заголовков столбцов, используя Колонны
Свойство объекта DataFrame.
print(excel_data_df.columns.ravel())
Выход:
['EmpID' 'EmpName' 'EmpRole']
3. Печать данных столбца
Мы можем получить данные столбца и преобразовать его в список значений.
print(excel_data_df['EmpName'].tolist())
Выход:
['Pankaj', 'David Lee', 'Lisa Ray']
4. Pandas Read_Excel () Пример USECols
Мы можем указать имена столбцов, которые будут прочитаны из файла Excel. Это полезно, когда вас интересует только несколько столбцов листа Excel.
import pandas excel_data_df = pandas.read_excel('records.xlsx', sheet_name='Cars', usecols=['Car Name', 'Car Price']) print(excel_data_df)
Выход:
Car Name Car Price 0 Honda City 20,000 USD 1 Bugatti Chiron 3 Million USD 2 Ferrari 458 2,30,000 USD
5. Чтение файла Excel без строки заголовка
Если лист Excel не имеет какого-либо строки заголовка, передайте значение параметра заголовка как никто.
excel_data_df = pandas.read_excel('records.xlsx', sheet_name='Numbers', header=None)
Если вы передаете значение заголовка как целое число, скажем, 3. Затем третий ряд будет рассматриваться как строка заголовка, а значения будут прочитаны из следующей строки. Любые данные до строки заголовка будут отброшены.
6. Лист Excel для Dict, CSV и JSON
Объект DataFrame имеет различные методы утилиты для преобразования табличных данных в Dict, CSV или JSON формат.
excel_data_df = pandas.read_excel('records.xlsx', sheet_name='Cars', usecols=['Car Name', 'Car Price']) print('Excel Sheet to Dict:', excel_data_df.to_dict(orient='record')) print('Excel Sheet to JSON:', excel_data_df.to_json(orient='records')) print('Excel Sheet to CSV:\n', excel_data_df.to_csv(index=False))
Выход:
Excel Sheet to Dict: [{'Car Name': 'Honda City', 'Car Price': '20,000 USD'}, {'Car Name': 'Bugatti Chiron', 'Car Price': '3 Million USD'}, {'Car Name': 'Ferrari 458', 'Car Price': '2,30,000 USD'}] Excel Sheet to JSON: [{"Car Name":"Honda City","Car Price":"20,000 USD"},{"Car Name":"Bugatti Chiron","Car Price":"3 Million USD"},{"Car Name":"Ferrari 458","Car Price":"2,30,000 USD"}] Excel Sheet to CSV: Car Name,Car Price Honda City,"20,000 USD" Bugatti Chiron,3 Million USD Ferrari 458,"2,30,000 USD"