Автор оригинала: Pankaj Kumar.
Как получить уникальные значения из DataFrame в Python?
Здравствуйте, читатели! В этой статье мы будем сосредоточиться на Как получить уникальные значения из Dataframe в Python Отказ
Итак, давайте начнем!
Что такое Python DataFrame?
Модуль Python Pandas предлагает нам различные структуры данных и функции для хранения и манипулирования огромным объемом данных.
Dataframe Является ли структурированные данные PandaS модулем Pandas для решения больших наборов данных в более чем в одном измерении, таких как огромные файлы CSV или Excel и т. Д.
Как мы можем хранить большой объем данных в кадре данных, мы часто встречаемся в ситуации, чтобы найти уникальные значения данных из набора данных, который может содержать избыточные или повторные значения.
Это когда Pandas.dataframe.unique () Функция
входит в картину.
Давайте теперь будем сосредоточиться на функционировании уникальной () функции в предстоящем разделе.
Python Pandas.unique () Функция, чтобы получить уникальные значения из DataFrame
Pandas.unique () Функция
Возвращает уникальные значения, присутствующие в наборе данных.
Он в основном использует технику на основе хэш-таблиц для возврата неадрендальных значений из набора значений, присутствующих в структуре данных кадра/серии данных.
Давайте попробуем понять роль уникальной функции через пример
Рассмотрим набор данных, содержащий значения следующим образом: 1,2,3,2,4,3,2,3,2
Теперь, если мы применяем уникальную функцию, мы получим следующий результат: 1,2,3,4. При этом мы обнаружили уникальные значения набора данных.
Теперь давайте обсудим структуру функции PandaS.Unique () в следующем разделе.
Синтаксис Python Unique () Функция
Посмотрите на синтаксис ниже:
pandas.unique(data)
Вышеуказанный синтаксис полезен, когда данные имеют 1-мерную. Он представляет собой уникальное значение из 1-мерных значений данных (структура данных серии).
Но, что, если данные содержит более одного размера I.e. Строки и столбцы? Да, у нас есть решение для этого в синтаксисе ниже
pandas.dataframe.column-name.unique()
Этот синтаксис позволяет нам найти уникальные значения из определенного столбца набора данных.
Хорошо, что данные имеют категориальный тип для уникальной функции, чтобы воспользоваться правильными результатами. Более того, данные отображаются в порядке его возникновения в наборе данных.
Python Unique () Функция с сериалом Pandas
В приведенном ниже примере мы создали список, который содержит избыточные значения.
Кроме того, мы преобразовали список в структуру данных серии, поскольку она имеет одно измерение. Наконец, мы применили уникальную функцию () функцию для получения уникальных значений от данных.
Пример:
lst = [1,2,3,4,2,4] df = pandas.Series(lst) print("Unique values:\n") print(pandas.unique(df))
Выход:
Unique values: [1 2 3 4]
Python Unique () Функция с Pandas DataFrame
Давайте сначала загрузим набор данных в среду, как показано ниже
import pandas BIKE = pandas.read_csv("Bike.csv")
Вы можете найти набор данных здесь Отказ
Pandas.dataframe.nunique () Функция
Представляет уникальные значения, присутствующие в каждом столбце DataFrame.
BIKE.nunique()
Выход:
season 4 yr 2 mnth 12 holiday 2 weathersit 3 temp 494 hum 586 windspeed 636 cnt 684 dtype: int64
Кроме того, мы представляли уникальные значения, представляющие в столбце «сезон», используя ниже.
BIKE.season.unique()
Выход:
array([1, 2, 3, 4], dtype=int64)
Заключение
По этому, мы подошли к концу этой темы. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом.
Для большего количества таких постов, связанных с Python, оставаться настроенными, а до тех пор, как потом, счастливое обучение !! 🙂.