Рубрики
Без рубрики

Корреляционный регрессионный анализ в Python

Эй, ребята! В этой статье мы будем сосредоточиться на корреляционном анализе регрессии, чтобы найти корреляцию между переменными в Python. Итак, давайте начнем!

Автор оригинала: Pankaj Kumar.

Эй, ребята! В этой статье мы будем сосредоточиться на Корреляционный регрессионный анализ Чтобы найти корреляцию между переменными в питоне.

Итак, давайте начнем!

Что такое корреляционный регрессионный анализ?

Корреляционный регрессионный анализ является важным шагом в процессе предварительной обработки данных для моделирования наборов данных. Для любого набора данных очень важно изобразить отношения между переменными и понимать влияние переменных на общий прогноз данных, а также переменной цели/ответа.

Это когда корреляционный регрессионный анализ входит в картину.

Корреляционный анализ помогает нам анализировать аспекты данных

  • Отношения между независимыми переменными I.e. Информация, изображенная им и их корреляцией.
  • Влияние независимых переменных в зависимой переменной.

Для любого разработчика важно понять корреляцию между независимыми переменными.

Корреляционные диапазоны от От 0 до 1 Отказ Высокая корреляция между двумя переменными изображает, что обе переменные представляют ту же информацию.

Таким образом, это вызывает многоколлинеаральность, и мы можем упасть любые из этих переменных.

Поняв концепцию корреляции, давайте теперь попробуем реализовать ее практически в предстоящем разделе.

Нахождение корреляции между переменными

Давайте сначала начнем с импорта набора данных. Вы можете найти набор данных здесь Отказ Мы загрузили набор данных в среду, используя read_csv () функция.

Кроме того, мы сегрегировали все числовые переменные набора данных и сохраняли их. Потому что корреляция работает только на числовых данных. Мы применили Корр () Функция для изображения корреляции между переменными через корреляционную матрицу.

import pandas
data = pandas.read_csv("Bank_loan.csv")
#Using Correlation analysis to depict the relationship between the numeric/continuous data variables
numeric_col = ['age',employ','address','income','debtinc','creddebt','othdebt']
corr = data.loc[:,numeric_col].corr()
print(corr)

Выход:

Мы можем использовать функцию keaborn.Heatmap () для визуализации данных корреляции в диапазоне от 0 до 1, как показано ниже-

sn.heatmap(corr, annot=True)

Выход:

Заключение

По этому, мы подошли к концу этой темы. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом.

Для большего количества таких постов, связанных с Python, оставайся настроенными @ Python с MoonningDev и до тех пор, Happy Mounty !! 🙂.