Рубрики
Без рубрики

Случайный лес в Python

Здравствуйте, читатели! В этой статье мы будем сосредоточиться на случайном лесу в Python, подробно. Итак, давайте начнем! 🙂 Что такое случайная лесная модель? Перед

Автор оригинала: Pankaj Kumar.

Здравствуйте, читатели! В этой статье мы будем сосредоточиться на Случайный лес в Python , в деталях.

Итак, давайте начнем! 🙂.

Что такое случайная лесная модель?

Перед погружением глубоко в строительстве случайной лесной модели необходимо для нас понимать важность модели в машинном обучении и науке о данных.

Машинное обучение предлагает нам различные алгоритмы для работы над числовыми, а также категорическими значениями данных.

Случайный лес – это одна такая модель обучения машины. Это классификация, а также модель регрессии для предотвращения прогнозов на обозначенных значениях данных.

Быть точным, Случайное лес Модель ансамбля, в которой она строится огромная модель с несколькими моделями дерева решений. Модель ошибки дерева решений подается на другие деревья, чтобы минимизировать ошибка неправильной классификации модели. Это укрепляет модель с точки зрения прогнозирования значений данных с уменьшенными шансами по ошибке.

Случайным лесом помогает нам лучше эффективность модели, поскольку она снижает вероятность возникновения ошибок тренировок с помощью метода ансамблей в нее с помощью процесса мешка.

Давайте теперь будем сосредоточиться на шагах, чтобы построить случайную лесную модель в Python.

Шаги по созданию случайной лесной модели

  1. Выберите случайные точки данных «X» от данных тренировки.
  2. Создайте дерево решений на этих точках данных.
  3. Выберите количество деревьев, которые будут построены и повторите шаги 1 и 2.
  4. Далее, внутренне, ошибка неправильной классификации каждого дерева принятия решений подается на следующее дерево, и это продолжается до тех пор, пока не исчерпывает данные.

Простая реализация случайного леса

С целью реализации мы использовали набор данных Count Count Bike. Вы можете найти набор данных здесь !

В этом примере, поскольку мы использовали набор регрессии I.E. Переменная ответа является непрерывным типом, мы использовали случайную алгоритм регрессии в лесной регрессии здесь, как показано ниже!

Сначала мы загружаем набор данных в среду Python, используя read_csv () функция. Загрузив набор данных, мы затем разделите набор данных в тренировочные и тестовые значения.

Затем мы импортируем класс RandomForestreGressor через библиотеку Sklearn для реализации случайного леса.

  • Сначала мы создаем объект для модели, используя RandomForestreGressor () Функция и подходит для обучения, используя Fit () функция.
  • Далее, с прогнозировать () Функция, мы пытаемся предсказать значения данных тестового класса.
  • Мы используем Маап В качестве метрики ошибки используя функцию Maпе () (настроен).
  • Наконец, чтобы проверить эффективность модели, мы используем оценку точности.

Пример:

import pandas
BIKE = pandas.read_csv("day.csv")

###SAMPLING OF DATA -- Splitting of Data columns into Training and Test dataset###
categorical_col_updated = c('season','yr','mnth','weathersit','holiday')
library(dummies)
bike = bike_data
bike = dummy.data.frame(bike,categorical_col_updated)
dim(bike)

#Separating the depenedent and independent data variables into two dataframes.
library(caret)
set.seed(101)
split_val = createDataPartition(bike$cnt, p = 0.80, list = FALSE) 
train_data = bike[split_val,]
test_data = bike[-split_val,]

#Building the Decision Tree Model on our dataset
from sklearn.ensemble import RandomForestRegressor
Random_model = RandomForestRegressor(n_estimators=300).fit(X_train,Y_train)
Random_predict = Random_model.predict(X_test) #Predictions on Testing data

# Using MAPE error metrics to check for the error rate and accuracy level
Random_MAPE = MAPE(Y_test,Random_predict)
Accuracy_Random = 100 - Random_MAPE
print("MAPE: ",Random_MAPE)
print('Accuracy of Random Forest model: {:0.2f}%.'.format(Accuracy_Random))

Выход:

В этом мы получили среднюю абсолютную процентную ошибку 15%. Таким образом, случайная лесная модель дает нам точность на 84,5%.

MAPE:  15.563241604682945
Accuracy of Random Forest model: 84.44%.

Заключение

По этому, мы подошли к концу этой темы. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом.

Для более таких постов, связанных с Python, оставайся настроенными нами.

До этого, счастливое обучение! 🙂.