Рубрики
Без рубрики

Панды и создание данных данных

Здесь сегодня мы говорим о пандах, что такое кадр данных и как их создать. Так что сначала посмотрите о … Помечено Python, DataScience, DataFrame, Pandas.

Здесь сегодня мы говорим о пандах, что такое кадр данных и как их создать. Так что сначала увидите о пандах.

Панды

Pandas-это библиотека Python с открытым исходным кодом, предоставляющая высокопроизводительные инструменты манипулирования и анализом данных с использованием ее мощных структур данных. Название Pandas получено из данных Word Panel – эконометрики из многомерных данных.

[Pandas] получен из термина «панельные данные», термин эконометрики для наборов данных, которые включают наблюдения в течение нескольких периодов времени для одних и тех же людей.

У пандов так много применений, что может иметь смысл перечислить то, что он не может сделать, а не то, что он может сделать.

Этот инструмент по сути является домом ваших данных. Через панды вы знакомы с вашими данными, очищая, преобразуя и анализируя их.

Мы импортируем следующим образом:

>>> import pandas as pd

Python имеет три основных Структура данных : 1 Серия: _ Серия представляет собой одномерную меченную массив, способную удерживать любой тип данных (целые числа, строки, номера плавающей запятой, объекты Python и т. Д.). Метки оси в совокупности называются индексом. Основным методом создания серии является вызов:

>>> s = pd.Series(data, index=index)

Здесь, данные может быть много разных вещей:

  • Дикт питона
  • Ndarray
  • Скалярное значение (например, 5)

2 . Кадра данных: DataFrame-это двухмерная маркированная структура данных с столбцами потенциально разных типов. Вы можете думать об этом как о таблице электронной таблицы или таблице SQL, или о DICT серийных объектов. Как правило, это наиболее часто используемый объект Pandas. Как серия, DataFrame принимает много разных видов ввода:

  • DICT 1D NDARRAY, списки, DICTS или серии
  • 2-D numpy.ndarray
  • Структурированный или записывать ndarray
  • A Серии
  • Другой DataFrame
>>> d = {'one' : pd.Series([1., 2., 3.], index=['a', 'b', 'c']), 'two' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])}
>>> df = pd.DataFrame(d)
>>> df
   one  two
a  1.0  1.0
b  2.0  2.0
c  3.0  3.0
d  NaN  4.0

3 . Панель: Панель является несколько менее используемым, но все же важный контейнер для 3-мерных данных. Данные термина панели получены из эконометрики и частично отвечают за имя Pandas: Pan (el) -da (ta) -s Анкет Названия для 3 оси предназначены для того, чтобы дать некоторое семантическое значение для описания операций, включающих данные панели и, в частности, эконометрический анализ данных панели. Однако для строгих целей нарезки и нарезания нарезания сбора объектов DataFrame вы можете найти имена оси слегка произвольными:

  • Элементы: Ось 0, каждый элемент соответствует рамке данных, содержащемуся внутри
  • major_axis: ось 1, это индекс (строки) каждого из фреймов Data
  • minor_axis: ось 2, это столбцы каждого из фреймов Data Frames
>>> wp = pd.Panel(data)

Наиболее распространенная и используемая структура данных в пандах – DataFrame . Теперь мы видим разные способы сделать DataFrame Используя панды.

Первый – создание DataFrame Используя список списка:

Пример:

import pandas as pd    
data = [['Ram', 10], ['Aman', 15], ['Rishi', 14]]   
df = pd.DataFrame(data, columns = ['Name', 'Age'])   
df 

Выход:

Следующий метод – создать DataFrame с помощью Python диктат или ndarray Анкет

Пример:

import pandas as pd  
data = {'Name':['Ram', 'jhon', 'krish', 'jack'], 
        'Age':[20, 21, 19, 18]}  
df = pd.DataFrame(data) 
df 

Выход:

Далее следует импортировать данные из CSV файлы Для этого мы используем Pd.read_csv () функция Пример:

import pandas as pd
df = pd.read_csv('data.csv')  

Следующий путь – подключение База данных . Мы можем создать DataFrame с помощью База данных также. Мы забираем пример кода, который соединяет SQLite База данных и создает DataFrame Анкет

Для этого сначала создайте Соединение Объект, а затем используйте pd.read_sql_query () для создания DataFrame Анкет

import pandas as pd
import sqlite3
conn = sqlite3.connect("database.db")#put name of database
df = pd.read_sql_query(query)

Есть некоторые методы, из которых мы можем создать Кадр данных В пандах, но есть еще несколько способов создать Рамки данных Анкет Панды IO Инструменты Поддержите несколько типов формата файлов для чтения и написания данных, таких как CSV , Json , Html , SAS и многое другое. Для прочтения больше о пандах IO Инструменты Go Здесь или откройте эту ссылку: https://pandas.pydata.org/docs/user_guide/io.html#io

Спасибо за чтение

Оригинал: “https://dev.to/cdaman123/pandas-and-creating-dataframe-35oc”