Здесь сегодня мы говорим о пандах, что такое кадр данных и как их создать. Так что сначала увидите о пандах.
Панды
Pandas-это библиотека Python с открытым исходным кодом, предоставляющая высокопроизводительные инструменты манипулирования и анализом данных с использованием ее мощных структур данных. Название Pandas получено из данных Word Panel – эконометрики из многомерных данных.
[Pandas] получен из термина «панельные данные», термин эконометрики для наборов данных, которые включают наблюдения в течение нескольких периодов времени для одних и тех же людей.
У пандов так много применений, что может иметь смысл перечислить то, что он не может сделать, а не то, что он может сделать.
Этот инструмент по сути является домом ваших данных. Через панды вы знакомы с вашими данными, очищая, преобразуя и анализируя их.
Мы импортируем следующим образом:
>>> import pandas as pd
Python имеет три основных Структура данных : 1 Серия: _ Серия представляет собой одномерную меченную массив, способную удерживать любой тип данных (целые числа, строки, номера плавающей запятой, объекты Python и т. Д.). Метки оси в совокупности называются индексом. Основным методом создания серии является вызов:
>>> s = pd.Series(data, index=index)
Здесь, данные
может быть много разных вещей:
- Дикт питона
- Ndarray
- Скалярное значение (например, 5)
2 . Кадра данных: DataFrame-это двухмерная маркированная структура данных с столбцами потенциально разных типов. Вы можете думать об этом как о таблице электронной таблицы или таблице SQL, или о DICT серийных объектов. Как правило, это наиболее часто используемый объект Pandas. Как серия, DataFrame принимает много разных видов ввода:
- DICT 1D NDARRAY, списки, DICTS или серии
- 2-D numpy.ndarray
- Структурированный или записывать ndarray
- A
Серии
- Другой
DataFrame
>>> d = {'one' : pd.Series([1., 2., 3.], index=['a', 'b', 'c']), 'two' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])} >>> df = pd.DataFrame(d) >>> df one two a 1.0 1.0 b 2.0 2.0 c 3.0 3.0 d NaN 4.0
3 . Панель: Панель является несколько менее используемым, но все же важный контейнер для 3-мерных данных. Данные термина панели получены из эконометрики и частично отвечают за имя Pandas: Pan (el) -da (ta) -s
Анкет Названия для 3 оси предназначены для того, чтобы дать некоторое семантическое значение для описания операций, включающих данные панели и, в частности, эконометрический анализ данных панели. Однако для строгих целей нарезки и нарезания нарезания сбора объектов DataFrame вы можете найти имена оси слегка произвольными:
- Элементы: Ось 0, каждый элемент соответствует рамке данных, содержащемуся внутри
- major_axis: ось 1, это индекс (строки) каждого из фреймов Data
- minor_axis: ось 2, это столбцы каждого из фреймов Data Frames
>>> wp = pd.Panel(data)
Наиболее распространенная и используемая структура данных в пандах – DataFrame
. Теперь мы видим разные способы сделать DataFrame
Используя панды.
Первый – создание DataFrame
Используя список списка:
Пример:
import pandas as pd data = [['Ram', 10], ['Aman', 15], ['Rishi', 14]] df = pd.DataFrame(data, columns = ['Name', 'Age']) df
Выход:
Следующий метод – создать DataFrame
с помощью Python диктат
или ndarray
Анкет
Пример:
import pandas as pd data = {'Name':['Ram', 'jhon', 'krish', 'jack'], 'Age':[20, 21, 19, 18]} df = pd.DataFrame(data) df
Выход:
Далее следует импортировать данные из CSV
файлы Для этого мы используем Pd.read_csv ()
функция Пример:
import pandas as pd df = pd.read_csv('data.csv')
Следующий путь – подключение База данных
. Мы можем создать DataFrame
с помощью База данных
также. Мы забираем пример кода, который соединяет SQLite
База данных и создает DataFrame
Анкет
Для этого сначала создайте Соединение
Объект, а затем используйте pd.read_sql_query ()
для создания DataFrame
Анкет
import pandas as pd import sqlite3 conn = sqlite3.connect("database.db")#put name of database df = pd.read_sql_query(query)
Есть некоторые методы, из которых мы можем создать Кадр данных
В пандах, но есть еще несколько способов создать Рамки данных
Анкет Панды IO Инструменты
Поддержите несколько типов формата файлов для чтения и написания данных, таких как CSV
, Json
, Html
, SAS
и многое другое. Для прочтения больше о пандах IO Инструменты
Go Здесь или откройте эту ссылку: https://pandas.pydata.org/docs/user_guide/io.html#io
Спасибо за чтение
Оригинал: “https://dev.to/cdaman123/pandas-and-creating-dataframe-35oc”