Реализация шагов обучения машины с использованием модели регрессии.

Из нашей предыдущей статьи мы посмотрели на шаги обучения машины. Теперь посмотрите, как реализовать модель обучения машины с помощью Python.

Используемый набор данных собирается из Kaggle Отказ

Мы сможем предсказать страховую сумму для человека.

Мы начинаем, импортируя необходимые модули, как показано:

import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import accuracy_score

Затем импортируйте данные.

data=pd.read_csv('insurance.csv')
data

Очистите данные, удалив дублирующие значения и преобразуйте колонн в числовые значения, чтобы облегчить работу.

label=LabelEncoder()
label.fit(data.sex.drop_duplicates())
data.sex=label.transform(data.sex)

label.fit(data.smoker.drop_duplicates())
data.smoker=label.transform(data.smoker)

label.fit(data.region.drop_duplicates())
data.region=label.transform(data.region)
data

Конечный набор данных, как показано ниже;

Используя очищенный набор данных, теперь разделите его на тренировки и тестовые наборы.

X=data.drop(['charges'], axis=1)
y=data[['charges']]
X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.33, random_state=42)

После разделения модели выберите подходящий алгоритм. В этом случае мы будем использовать линейную регрессию, поскольку нам нужно предсказать численное значение, основанное на некоторых параметрах.

model=LinearRegression())
model.fit(X_train,y_train)

Теперь предсказывает набор данных тестирования и найдите, насколько точны ваши прогнозы.

Оценка точности предсказана следующим образом:

Настройка параметров позволяет найти гиперпараметры, которые влияют на различные переменные в наборе данных.

Оригинал: “https://dev.to/phylis/implementing-machine-learning-steps-using-regression-model-4954”

Читайте ещё по теме: