Автор оригинала: Pankaj Kumar.
Здравствуйте, читатели! В этой статье мы будем сосредоточиться на Python ISNA () и NOTNA () Функции для предварительной обработки данных , в деталях.
Итак, давайте начнем !! 🙂.
Актуальность Python в предварительной обработке данных
Python предлагает нам огромное количество модулей и встроенных функций для решения данных. В области науки о данных, предварительная обработка данных играет жизненно важную роль. Это процесс очистки данных и делает его доступным для использования и обработки. Этим, мы понимаем данные намного лучше, а также позволяет нам устранить нежелательные значения из данных.
Необработанные данные содержат различные формы элементов, поскольку они, кажется, являются результатом опросов, исторических данных и т. Д. Для того, чтобы выровнять данные в понявном формате, нам нужны функции для лечения данных.
Одним из таких важных аспектов в предварительно обработке данных является отсутствующий анализ значения. Что касается отсутствующего анализа ценностей, мы склонны проверять наличие отсутствующих или нулевых значений, и мы либо относимся к ним, либо исключаем их из набора данных, поскольку он вызывает неравномерное распределение данных.
Когда дело доходит до начальной очистки и отсутствующего анализа данных, модуль Python Pandas предлагает нам две важные функции для того же
- ISNA () Функция
- Функция Notna ()
В контексте концепции этой темы мы подробно посмотрим на вышеуказанные функции. На то же, мы будем использовать набор данных прогнозирования проката велосипеда в предстоящих примерах.
Вы можете найти набор данных здесь !
1. Функция Python ISNA ()
На начальных этапах предварительной обработки данных и отсутствующего анализа стоимости, функция Python ISNA () приходит к нашему спасению, чтобы передать нам недостающие данные значения.
То есть с функцией isna () мы можем легко обнаружить наличие отсутствующего значения, которое является значением NULL или NA от всего набора данных. Это логическая функция, которая возвращается только в том случае, если набор данных состоит из пропущенных значений.
Таким образом, для быстрой и легкой проверки предварительной обработки, функция ISNA () может быть использована для того, чтобы помочь нам иметь представление о пропущенных значениях в наборе данных.
Синтаксис-
pandas.dataframe.isna()
Пример-
import pandas data = pandas.read_csv("bike.csv") data.isna()
Выход-
Как ясно видно ниже функция ISNA () проверяет наличие отсутствующего значения на каждом элементе и возвращает false в качестве результата. Это означает, что набор данных свободен от пропущенных значений.
2. Функция Python Notna ()
Напротив функции ISNA () функция Python Notna () является быстрым и простым способом для представления этих элементов данных, которые не имеют недостающих значений в них.
Время от времени мы сталкиваемся с ситуациями, когда мы чувствуем необходимость разделить и проверять данные против отсутствующих значений, в этой точке функции NOTNA () можно использовать.
Функция NOTNA () – это логическая функция, которая возвращает только правда, и только в том случае, если переменная данных не занимает ноль или отсутствующих данных.
Синтаксис-
pandas.dataframe.notna()
Пример-
import pandas data = pandas.read_csv("bike.csv") data.notna()
Выход-
Как видно ниже функция NOTNA () возвращает true, поскольку она не содержит отсутствующих значений.
Заключение
По этому, мы подошли к концу этой темы. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом.
Для более таких постов, связанных с программированием Python, оставайся настроенными нами.
До этого, счастливого обучения !! 🙂.