Рубрики
Без рубрики

Как разбирать файлы CSV в Python

Как разбирать файлы CSV в Python с использованием встроенного модуля CSV. Модуль Python Pandas для чтения данных CSV и записи файлов CSV, работая с файлами CSV в Python.

Автор оригинала: Pankaj Kumar.

Файлы CSV много используются в хранении табличных данных в файл. Мы можем легко экспортировать данные из таблиц базы данных или файлов Excel в файлы CSV. Также легко читать люди, а также в программе. В этом руководстве мы узнаем, как разбирать файлы CSV в Python.

Что такое разбор?

Разбор файла означает чтение данных из файла. Файл может содержать текстовые данные так называемые текстовые файлы, или они могут быть электронной таблицей.

Какой файл CSV?

CSV обозначает запятые файлы, то есть данные разделены с использованием запятой друг от друга. Файлы CSV создаются программой, которая обрабатывает большое количество данных. Данные из файлов CSV могут быть легко экспортированы в виде электронной таблицы и базы данных, а также импортированные для использования другими программами.

Давайте посмотрим, как разбирать файл CSV. Разборные файлы CSV в Python довольно легко. Python имеет встроенную библиотеку CSV, которая обеспечивает функциональность обоих чтений, так и записи данных из файлов CSV и CSV. В библиотеке доступны различные форматы для файлов CSV, что делает обработку данных для пользователя.

Разбор файла CSV в Python

Чтение файлов CSV с использованием встроенного модуля CSV Python.

import csv

with open('university_records.csv', 'r') as csv_file:
    reader = csv.reader(csv_file)

    for row in reader:
        print(row)

Выход:

Написание файла CSV в Python

Для записи файла мы должны открыть его в режиме записи или в режиме добавления. Здесь мы добавим данные к существующему файлу CSV.

import csv

row = ['David', 'MCE', '3', '7.8']

row1 = ['Lisa', 'PIE', '3', '9.1']

row2 = ['Raymond', 'ECE', '2', '8.5']

with open('university_records.csv', 'a') as csv_file:
    writer = csv.writer(csv_file)

    writer.writerow(row)

    writer.writerow(row1)

    writer.writerow(row2)

Python добавляет к файлу CSV

Разбронировать файлы CSV с помощью библиотеки Pandas

Есть еще один способ работать с файлами CSV, который является самым популярным и более профессиональным, и это использует библиотеку Pandas.

Pandas – библиотека анализа данных Python. Он предлагает различные структуры, инструменты и операции для работы и манипулирования данными, которые являются в основном двумерными или одномерными таблицами.

Использование и особенности библиотеки Pandas

  • Наборы данных поворот и изменение.
  • Манипуляция данных с индексацией с использованием объектов DataFrame.
  • Фильтрация данных.
  • Слияние и присоединение к работе на наборах данных.
  • Нарезка, индексирование и подмножество массивных наборов данных.
  • Отсутствующие данные обработки данных и выравнивание данных.
  • Вставка и удаление строки/столбца.
  • Одномерные разные форматы файлов.
  • Чтение и запись инструментов для данных в различных форматах файлов.

Чтобы работать с файлом CSV, вам нужно установить Pandas. Установка PandA довольно проста, следуйте инструкциям ниже, чтобы установить его с помощью PIP.

$ pip install pandas

Python устанавливает пандас

Python Установка Pandas CMD

Как только установка будет завершена, вы хороши, чтобы пойти.

Чтение файла CSV с помощью модуля PandaS

Вам нужно знать путь, в котором ваш файл данных находится в вашей файловой системе, и какой ваш текущий рабочий каталог перед использованием Pandas для импорта данных файла CSV.

Я предлагаю держать свой код и файл данных в том же каталоге или папке, чтобы вам не нужно было указать путь, который сэкономит ваше время и пространство.

import pandas

result = pandas.read_csv('ign.csv')

print(result)

Выход

Прочитайте файл CSV с помощью модуля PandaS

Написание файла CSV с помощью модуля PandaS

Написание файлов CSV с помощью PandaS так же просто, как показания. Единственный новый термин используется Dataframe Отказ

PandaS DataFrame – это двумерная, гетерогенная структура таблиц данных (данные расположены в табличной моде в рядах и столбцах.

PandaS DataFrame состоит из трех основных компонентов – данные, столбцы и строки – с надписью оси x и y y y (строки и столбцы).

from pandas import DataFrame

C = {'Programming language': ['Python', 'Java', 'C++'],

     'Designed by': ['Guido van Rossum', 'James Gosling', 'Bjarne Stroustrup'],

     'Appeared': ['1991', '1995', '1985'],

     'Extension': ['.py', '.java', '.cpp'],

     }

df = DataFrame(C, columns=['Programming language', 'Designed by', 'Appeared', 'Extension'])

export_csv = df.to_csv(r'program_lang.csv', index=None, header=True)

Выход

Python Pandas написать файл CSV

Заключение

Мы научились анализировать файл CSV с использованием встроенного модуля CSV и модуль PandaS. Существует много разных способов анализа файлов, но программисты не используют их.

Библиотеки, такие как PLYPLUS, PLY и ANTLR – некоторые из библиотек, используемых для анализа текстовых данных. Теперь вы знаете, как использовать Inbuilt Biblic CSV и мощный модуль Panda для чтения и записи данных в формате CSV. Коды, показанные выше, очень базовые и простые. Это понятно кто знаком с Python, поэтому я не думаю, что есть какие-либо потребности в объяснении.

Однако манипулирование сложных данных с пустыми и неоднозначными вводами данных нелегко. Это требует практики и знания различных инструментов в Пандах. CSV – лучший способ сохранения и совместного использования данных. Pandas – отличная альтернатива модулям CSV. Вам может быть трудно вначале, но это не так сложно учиться. С небольшим количеством практики вы будете освоить это.