Автор оригинала: Pankaj Kumar.
Файлы CSV много используются в хранении табличных данных в файл. Мы можем легко экспортировать данные из таблиц базы данных или файлов Excel в файлы CSV. Также легко читать люди, а также в программе. В этом руководстве мы узнаем, как разбирать файлы CSV в Python.
Что такое разбор?
Разбор файла означает чтение данных из файла. Файл может содержать текстовые данные так называемые текстовые файлы, или они могут быть электронной таблицей.
Какой файл CSV?
CSV обозначает запятые файлы, то есть данные разделены с использованием запятой друг от друга. Файлы CSV создаются программой, которая обрабатывает большое количество данных. Данные из файлов CSV могут быть легко экспортированы в виде электронной таблицы и базы данных, а также импортированные для использования другими программами.
Давайте посмотрим, как разбирать файл CSV. Разборные файлы CSV в Python довольно легко. Python имеет встроенную библиотеку CSV, которая обеспечивает функциональность обоих чтений, так и записи данных из файлов CSV и CSV. В библиотеке доступны различные форматы для файлов CSV, что делает обработку данных для пользователя.
Разбор файла CSV в Python
Чтение файлов CSV с использованием встроенного модуля CSV Python.
import csv
with open('university_records.csv', 'r') as csv_file:
reader = csv.reader(csv_file)
for row in reader:
print(row)
Выход:
Написание файла CSV в Python
Для записи файла мы должны открыть его в режиме записи или в режиме добавления. Здесь мы добавим данные к существующему файлу CSV.
import csv
row = ['David', 'MCE', '3', '7.8']
row1 = ['Lisa', 'PIE', '3', '9.1']
row2 = ['Raymond', 'ECE', '2', '8.5']
with open('university_records.csv', 'a') as csv_file:
writer = csv.writer(csv_file)
writer.writerow(row)
writer.writerow(row1)
writer.writerow(row2)
Python добавляет к файлу CSV
Разбронировать файлы CSV с помощью библиотеки Pandas
Есть еще один способ работать с файлами CSV, который является самым популярным и более профессиональным, и это использует библиотеку Pandas.
Pandas – библиотека анализа данных Python. Он предлагает различные структуры, инструменты и операции для работы и манипулирования данными, которые являются в основном двумерными или одномерными таблицами.
Использование и особенности библиотеки Pandas
- Наборы данных поворот и изменение.
- Манипуляция данных с индексацией с использованием объектов DataFrame.
- Фильтрация данных.
- Слияние и присоединение к работе на наборах данных.
- Нарезка, индексирование и подмножество массивных наборов данных.
- Отсутствующие данные обработки данных и выравнивание данных.
- Вставка и удаление строки/столбца.
- Одномерные разные форматы файлов.
- Чтение и запись инструментов для данных в различных форматах файлов.
Чтобы работать с файлом CSV, вам нужно установить Pandas. Установка PandA довольно проста, следуйте инструкциям ниже, чтобы установить его с помощью PIP.
$ pip install pandas
Python устанавливает пандас
Python Установка Pandas CMD
Как только установка будет завершена, вы хороши, чтобы пойти.
Чтение файла CSV с помощью модуля PandaS
Вам нужно знать путь, в котором ваш файл данных находится в вашей файловой системе, и какой ваш текущий рабочий каталог перед использованием Pandas для импорта данных файла CSV.
Я предлагаю держать свой код и файл данных в том же каталоге или папке, чтобы вам не нужно было указать путь, который сэкономит ваше время и пространство.
import pandas
result = pandas.read_csv('ign.csv')
print(result)
Выход
Прочитайте файл CSV с помощью модуля PandaS
Написание файла CSV с помощью модуля PandaS
Написание файлов CSV с помощью PandaS так же просто, как показания. Единственный новый термин используется Dataframe Отказ
PandaS DataFrame – это двумерная, гетерогенная структура таблиц данных (данные расположены в табличной моде в рядах и столбцах.
PandaS DataFrame состоит из трех основных компонентов – данные, столбцы и строки – с надписью оси x и y y y (строки и столбцы).
from pandas import DataFrame
C = {'Programming language': ['Python', 'Java', 'C++'],
'Designed by': ['Guido van Rossum', 'James Gosling', 'Bjarne Stroustrup'],
'Appeared': ['1991', '1995', '1985'],
'Extension': ['.py', '.java', '.cpp'],
}
df = DataFrame(C, columns=['Programming language', 'Designed by', 'Appeared', 'Extension'])
export_csv = df.to_csv(r'program_lang.csv', index=None, header=True)
Выход
Python Pandas написать файл CSV
Заключение
Мы научились анализировать файл CSV с использованием встроенного модуля CSV и модуль PandaS. Существует много разных способов анализа файлов, но программисты не используют их.
Библиотеки, такие как PLYPLUS, PLY и ANTLR – некоторые из библиотек, используемых для анализа текстовых данных. Теперь вы знаете, как использовать Inbuilt Biblic CSV и мощный модуль Panda для чтения и записи данных в формате CSV. Коды, показанные выше, очень базовые и простые. Это понятно кто знаком с Python, поэтому я не думаю, что есть какие-либо потребности в объяснении.
Однако манипулирование сложных данных с пустыми и неоднозначными вводами данных нелегко. Это требует практики и знания различных инструментов в Пандах. CSV – лучший способ сохранения и совместного использования данных. Pandas – отличная альтернатива модулям CSV. Вам может быть трудно вначале, но это не так сложно учиться. С небольшим количеством практики вы будете освоить это.