Линейная регрессия с помощью Scikit-learn (часть 2)

Это Вторая часть И здесь мы будем говорить о Множественная линейная регрессия Анкет

Вопросы На всех ваших умах:

Что такое многочисленная линейная регрессия?

Это Статистическая техника который использует несколько объяснительных переменных для Предсказать результат переменной ответа.
Множественная линейная регрессия используется для оценивать Отношения Между две или более независимых переменных и одна зависимая переменная Анкет

С Множественная линейная регрессия (MLR), вы можете прогнозировать цена машины, дома и многого другого.

Прежде чем мы начнем кодирование, вам нужно будет установить набор данных, который мы будем использовать. Нажмите Здесь Чтобы загрузить набор данных, который мы будем использовать. Откройте файл с именем 50_Startups.csv Анкет Вы должны увидеть что -то вроде этого:

Изображение

Цель дня

Мы собираемся сделать Регрессионная модель это сможет предсказывать прибыль стартапов.

Мы начнем кодирование в настоящее время.

Импорт библиотек

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression

Загрузить и просмотреть набор данных

df = pd.read_csv('50_Startups.csv')
df.head()

Вывод

Изображение

Извлечение функций

Что такое извлечение функций?

Извлечение признаков – это процесс снижения размерности, с помощью которого начальный набор необработанных данных уменьшается до более управляемых групп для обработки.
С другой стороны, это акт выбора полезных функций из набора данных и остального.

data = df[['R&D Spend', 'Administration', 'Marketing Spend']]
data = data.values.reshape(-1,3)
labels = df[['Profit']]

Как видите, я не выбрал Государство столбец должен быть частью данных. Причина в том, что это не на самом деле необходимо, и любые ненужные данные уменьшит шансы на ваш Точность модели Быть Высокий Анкет

Создание регрессионной модели

model = LinearRegression()
model.fit(data,labels)
print(model.score(data,labels))

Вывод 0,9507459940683246

Обратите внимание : Чем ближе точность к 1.0 Чем лучше это. Это увеличивает вероятность того, что прогноз вашей модели будет правдой.

Сделать прогнозы с вашей моделью

print(model.predict([[165349.20, 136897.80, 471784.10]]))
print(model.predict([[144372.41, 118671.85, 383199.62]]))

ВЫХОД

[[192521.25289008]]
[[173696.70002553]]

Вот как это просто. Теперь вы сделали то, что вы предсказали прибыль стартапа от некоторых из их расходов.

Вы можете посетить Kaggle Чтобы найти больше наборов данных, на которых вы можете выполнить линейную регрессию.

Проверьте мой Twitter или Instagram Анкет

Не стесняйтесь задавать вопросы в комментариях Анкет

Удачи 👍

Оригинал: “https://dev.to/mrcodeslinger/linear-regression-with-scikit-learn-part-2-4i8h”