Автор оригинала: Pankaj Kumar.
Как нормализовать данные в Python – все, что вам нужно знать
Привет читатели! В этой статье. Мы будем сосредоточены на том, как мы можем нормализовать данные в Python. Итак, давайте начнем.
Что такое нормализация?
Перед погружением в нормализацию давайте сначала понять потребность в этом !!
Функция масштабирования является важным шагом в анализе данных и подготовке данных для моделирования. Где мы делаем масштаб данных без масштаба для легкого анализа.
Нормализация является одним из методов масштабирования функций. Мы особенно применяем нормализацию, когда данные являются Перекошенные На любой оси I.e. Когда данные не следуют за Гауссовое распределение Отказ
В Нормализация Мы Преобразовать функции данных разных масштабов в общее масштаб Что еще может легко обработать данные для моделирования. Таким образом, все функции данных (переменные) имеют тенденцию оказывают аналогичное влияние на часть моделирования.
Согласно формуле ниже, мы нормализуем каждую функцию, вычитая минимальное значение данных из переменной данных, а затем разделите ее по диапазону переменной, как показано
Таким образом, мы преобразуем значения в диапазон между [0,1] Отказ Теперь попробуем реализовать концепцию нормализации в Python в предстоящем разделе.
Шаги для нормализации данных в Python
Существуют различные подходы в Python, через который мы можем выполнять нормализацию.
Сегодня мы будем использовать один из самых популярных способов- Minmaxscaler Отказ
Давайте сначала посмотрите на набор данных, который мы будем распространяться вперед.
Dataset:
Далее мы будем использовать Мин и максимальный масштабирование в Sklearn выполнять нормализацию.
Пример:
import pandas as pd import os from sklearn.preprocessing import MinMaxScaler #Changing the working directory to the specified path-- os.chdir("D:/Normalize - Loan_Defaulter") data = pd.read_csv("bank-loan.csv") # dataset scaler = MinMaxScaler() loan=pd.DataFrame(scaler.fit_transform(data), columns=data.columns, index=data.index) print(loan)
Здесь мы создали объект Minmaxscaler ()
Класс Отказ Далее мы использовали fit_transform () Метод
нормализовать значения данных.
Выход:
Таким образом, как ясно видно, мы преобразовали и нормализовали значения данных в диапазоне 0 и 1.
Резюме
Таким образом, из вышеизложенного объяснения могут быть нарисованы следующие идеи
- Нормализация используется, когда значения данных являются Перекошенные и Не следуйте за гауссовом распределении Отказ
- Значения данных превращаются между A Диапазон 0 и 1 Отказ
- Нормализация делает данные масштаб бесплатно Отказ
Заключение
По этому, мы подошли к концу этой статьи. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом.
До тех пор оставайтесь настроенными @ Python с Askpython и продолжайте учиться !!