Автор оригинала: Pankaj Kumar.
Эй, ребята! В этой статье мы будем сосредоточиться на Корреляционный регрессионный анализ Чтобы найти корреляцию между переменными в питоне.
Итак, давайте начнем!
Что такое корреляционный регрессионный анализ?
Корреляционный регрессионный анализ является важным шагом в процессе предварительной обработки данных для моделирования наборов данных. Для любого набора данных очень важно изобразить отношения между переменными и понимать влияние переменных на общий прогноз данных, а также переменной цели/ответа.
Это когда корреляционный регрессионный анализ входит в картину.
Корреляционный анализ помогает нам анализировать аспекты данных
- Отношения между независимыми переменными I.e. Информация, изображенная им и их корреляцией.
- Влияние независимых переменных в зависимой переменной.
Для любого разработчика важно понять корреляцию между независимыми переменными.
Корреляционные диапазоны от От 0 до 1 Отказ Высокая корреляция между двумя переменными изображает, что обе переменные представляют ту же информацию.
Таким образом, это вызывает многоколлинеаральность, и мы можем упасть любые из этих переменных.
Поняв концепцию корреляции, давайте теперь попробуем реализовать ее практически в предстоящем разделе.
Нахождение корреляции между переменными
Давайте сначала начнем с импорта набора данных. Вы можете найти набор данных здесь Отказ Мы загрузили набор данных в среду, используя read_csv () функция.
Кроме того, мы сегрегировали все числовые переменные набора данных и сохраняли их. Потому что корреляция работает только на числовых данных. Мы применили Корр ()
Функция для изображения корреляции между переменными через корреляционную матрицу.
import pandas data = pandas.read_csv("Bank_loan.csv") #Using Correlation analysis to depict the relationship between the numeric/continuous data variables numeric_col = ['age',employ','address','income','debtinc','creddebt','othdebt'] corr = data.loc[:,numeric_col].corr() print(corr)
Выход:
Мы можем использовать функцию keaborn.Heatmap () для визуализации данных корреляции в диапазоне от 0 до 1, как показано ниже-
sn.heatmap(corr, annot=True)
Выход:
Заключение
По этому, мы подошли к концу этой темы. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом.
Для большего количества таких постов, связанных с Python, оставайся настроенными @ Python с MoonningDev и до тех пор, Happy Mounty !! 🙂.