Из нашей предыдущей статьи мы посмотрели на шаги обучения машины. Теперь посмотрите, как реализовать модель обучения машины с помощью Python.
Используемый набор данных собирается из Kaggle Отказ
Мы сможем предсказать страховую сумму для человека.
- Мы начинаем, импортируя необходимые модули, как показано:
import pandas as pd from sklearn.preprocessing import LabelEncoder from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression from sklearn.metrics import accuracy_score
- Затем импортируйте данные.
data=pd.read_csv('insurance.csv') data
- Очистите данные, удалив дублирующие значения и преобразуйте колонн в числовые значения, чтобы облегчить работу.
label=LabelEncoder() label.fit(data.sex.drop_duplicates()) data.sex=label.transform(data.sex) label.fit(data.smoker.drop_duplicates()) data.smoker=label.transform(data.smoker) label.fit(data.region.drop_duplicates()) data.region=label.transform(data.region) data
Конечный набор данных, как показано ниже;
- Используя очищенный набор данных, теперь разделите его на тренировки и тестовые наборы.
X=data.drop(['charges'], axis=1) y=data[['charges']] X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.33, random_state=42)
- После разделения модели выберите подходящий алгоритм. В этом случае мы будем использовать линейную регрессию, поскольку нам нужно предсказать численное значение, основанное на некоторых параметрах.
model=LinearRegression()) model.fit(X_train,y_train)
- Теперь предсказывает набор данных тестирования и найдите, насколько точны ваши прогнозы.
- Оценка точности предсказана следующим образом:
- Настройка параметров позволяет найти гиперпараметры, которые влияют на различные переменные в наборе данных.
Оригинал: “https://dev.to/phylis/implementing-machine-learning-steps-using-regression-model-4954”