Рубрики
Без рубрики

3 Простые способы создать подмножество Python DataFrame

Здравствуйте, читатели! В этой статье мы будем сосредоточены на разных способах создания подмножества данных Python DataFrame подробно. Итак, давайте начнем! Первый,

Автор оригинала: Pankaj Kumar.

Здравствуйте, читатели! В этой статье мы будем сосредоточиться на разных Способы создать подмножество Python DataFrame в деталях.

Итак, давайте начнем!

Во-первых, что такое DataFrame Python?

Модуль Python Pandas предоставляет нам две структуры данных, а именно, серии и DataFrame для хранения значений.

А Dataframe Это структура данных, которая содержит данные в виде матрицы I.E. Он содержит данные в целевой форме строк и столбцов. Таким образом, в ассоциации с ним мы можем создавать и получать доступ к подмножеству его в форматах ниже:

  • Доступ к данным в соответствии со строками в качестве подмножества
  • Получите данные в соответствии с столбцами как подмножество
  • Доступ к конкретным данным из нескольких строк, а также столбцов в качестве подмножества

Поняв о DataFrame и подмножестве данных, давайте теперь понять различные методы для создания подмножества из DataFrame.

Создание DataFrame для работы с!

Для создания подмножеств DataFrame нам нужно создать dataframe. Давайте сначала выйдут это из нашего пути:

import pandas as pd 
data = {"Roll-num": [10,20,30,40,50,60,70], "Age":[12,14,13,12,14,13,15], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}
block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)

Выход:

Original Data frame:

   Roll-num  Age    NAME
0        10   12    John
1        20   14  Camili
2        30   13  Rheana
3        40   12  Joseph
4        50   14  Amanti
5        60   13   Alexa
6        70   15    Siri

Здесь мы создали кадр данных, используя Pandas.dataframe () метод. Мы будем использовать вышеупомянутый набор данных по всей этой статье

Начнем!

1. Создайте подмножество данных Python DataFrame с помощью функции LOC ()

Функция Python Loc () позволяет нам сформировать подмножество кадров данных в соответствии с определенной строкой или столбцом или комбинацией обоих.

loc () Функция Работает на основе этикеток I.e. Нам нужно предоставить ему метку строки/столбца, чтобы выбрать и создать настроенное подмножество.

Синтаксис:

pandas.dataframe.loc[]

Пример 1: Извлечь данные о конкретных рядах DataFrame

block.loc[[0,1,3]]

Выход:

Как видно ниже, мы создали подмножество, которое включает в себя все данные строки 0, 1 и 3.

Roll-num	Age	NAME
0	10	12	John
1	20	14	Camili
3	40	12	Joseph

Пример 2: Создайте подмножество строк с помощью нарезки

block.loc[0:3]

Здесь мы извлекли данные всех строк из индекса 0 до индекса 3, используя оператор нарезки с функцией SC ().

Выход:

Roll-num	Age	NAME
0	10	12	John
1	20	14	Camili
2	30	13	Rheana
3	40	12	Joseph

Пример 3: Создайте подмножество определенных столбцов с помощью меток

block.loc[0:2,['Age','NAME']]

Выход:

Age	NAME
0	12	John
1	14	Camili
2	13	Rheana

Здесь мы создали подмножество, которое включает в себя данные с рядов от 0 до 2, но включает в себя только некоторые определенные столбцы I.e. «Возраст» и «Имя».

2. Использование функции Python ILOC () для создания подмножества данных DataFrame

Python Iloc () Функция Позволяет нам создать подмножество, выбрав определенные значения от рядов и столбцов на основе индексов.

То есть В отличие от функции LOC (), которая работает на метках, функции ILOC () работает на значении индекса Отказ Мы можем выбрать и создать подмножество данных Python DataFrame из данных, обеспечивающих номера индекса рядов и столбцов.

Синтаксис:

pandas.dataframe.iloc[]

Пример:

block.iloc[[0,1,3,6],[0,2]]

Здесь мы создали подмножество, которое включает в себя данные строки 0,1,3 и 6, а также номер столбца 0 и 2 I.e. «Roll-Num» и «Имя».

Выход:

Roll-num	NAME
0	10	John
1	20	Camili
3	40	Joseph
6	70	Siri

3. Оператор индексации для создания подмножества DataFrame

Простым способом мы можем использовать оператор индексации I.E. Квадратные скобки для создания подмножества данных.

Синтаксис:

dataframe[['col1','col2','colN']]

Пример:

block[['Age','NAME']]

Здесь мы выбрали все значения данных «Возрастки» и «Имя», соответственно.

Выход :

Age	NAME
0	12	John
1	14	Camili
2	13	Rheana
3	12	Joseph
4	14	Amanti
5	13	Alexa
6	15	Siri

Заключение

По этому, мы подошли к концу этой темы. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом. Для получения дополнительных таких постов, связанных с Python, оставайся настроенными, а до тех пор, и до тех пор, Happy Surlege !! 🙂.