Рубрики
Без рубрики

Корреляционная матрица в Python – практическая реализация

Эй, читатели! В этой статье мы будем сосредоточиться на появлении и работе корреляционной матрицы в Python подробно. Итак, давайте начнем сейчас!

Автор оригинала: Pankaj Kumar.

Корреляционная матрица в Python – практическая реализация

Эй, читатели! В этой статье мы будем сосредоточиться на появлении и работе корреляционная матрица в питоне подробно. Итак, давайте начнем сейчас!

Что такое корреляционный регрессионный анализ?

В домене Наука и машина науки и машины Мы часто сталкиваемся с ситуациями, в которой нам необходимо проанализировать переменные и выполнять выделение функций. Это когда корреляционный регрессионный анализ входит в картину.

Корреляционный регрессионный анализ позволяет программистам проанализировать отношения между Непрерывные независимые переменные и непрерывная зависимая переменная Отказ

То есть регрессионный анализ оценивает вероятность и взаимосвязь между независимыми переменными набора данных, а также независимыми и независимыми (зависимыми) переменными.

Анализ корреляции регрессионного анализа использует корреляционную матрицу для представления взаимосвязи между переменными набора данных.

Корреляционная матрица представляет собой матричную структуру, которая помогает программистую анализировать взаимосвязь между переменными данных. Он представляет собой корреляционное значение между диапазоном 0 и 1 Отказ

Положительное значение представляет хорошую корреляцию, и отрицательное значение представляет собой низкую корреляцию и значение, эквивалентное нулю (0), не представляет зависимости между конкретным набором переменных.

Можно изгнать следующие наблюдения от регрессионного анализа и матрицы корреляции:

  • Понять зависимость между независимыми переменными набора данных.
  • Помогает выбрать важные и нередительные переменные набора данных.
  • Применимо только к числовым/непрерывным переменным.

Давайте теперь сосредоточимся на реализации корреляционной матрицы в Python.

Создание корреляционной матрицы в Python

Давайте сначала начнем, исследуя набор данных, используемых в этом примере. Как видно ниже, набор данных содержит 4 независимых непрерывных переменных:

  • преданность
  • атемп
  • гул
  • скорость ветра
Correlation Matrix DataSet

Здесь CNT – это переменная ответа.

Теперь мы создали корреляционную матрицу для цифровых столбцов, используя Corr () Функция как показано ниже:

import os
import pandas as pd
import numpy as np
import seaborn as sn

# Loading the dataset
BIKE = pd.read_csv("day.csv")

# Numeric columns of the dataset
numeric_col = ['temp','atemp','hum','windspeed']

# Correlation Matrix formation
corr_matrix = BIKE.loc[:,numeric_col].corr()
print(corr_matrix)

#Using heatmap to visualize the correlation matrix
sn.heatmap(corr_matrix, annot=True)

Кроме того, мы использовали Weanborn Heatmamps для визуализации матрицы.

Выход:

Корреляционная матрица

Итак, из вышеуказанной матрицы, следующие наблюдения могут быть нарисованы

  • Переменные «TEMP» и «ATEMP» очень коррелируют со корреляционным значением 0,99 Отказ
  • Таким образом, мы можем бросить любую одну из двух переменных данных.
Корреляционная матричная тепломапа

Заключение

По этому, мы подошли к концу этой темы. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом.

До этого, счастливого обучения !!