– Все изображения (участки) генерируются и изменены автором.
Возможно, для каждого практикующего данных Линейная регрессия Бывает отправной точкой при внедрении машинного обучения, где вы узнаете о предвидеть непрерывное значение для данного независимого набора правил Отказ
Почему логистические, не линейные?
Давайте начнем с самого основного, в Бинарная классификация Модель должна иметь возможность предсказать зависимую переменную в качестве одного из двух вероятных классов, которые могут быть 0 или 1 Отказ Если мы рассмотрим использование Линейная регрессия , мы можем предсказать значение для данного набора правил в качестве ввода в модели, но он прогнозирует непрерывные значения, такие как 0,03, +1,2, -0,9 и т. Д. Что не подходит для классификации его в одном из двух классов, которые не идентифицируют его как значение вероятности для прогнозирования класса.
Например. Когда мы должны предсказать, является ли веб-сайт злонамеренным, когда длина URL-адреса приведена как функция, переменная ответа имеет два значения, доброкачественные и вредоносные.
Если мы попытаемся установить линейную модель регрессии в проблему бинарной классификации, модель подходит для модели, будет прямой линией и видно, почему она не подходит для использования той же.
Чтобы преодолеть эту проблему, мы используем Сигмовидная функция , который пытается установить экспоненциальную кривую к данным, чтобы построить хорошую модель.
Логистическая/сигмовидная функция
Логистическая регрессия может быть объяснена Логистическая функция , также известный как Сигмовидная функция который принимает любой реальный вход х и выводит значение вероятности от 0 до 1, которое определяется как,
Модель подходит с использованием вышеуказанной логистической функции, можно рассматривать как ниже:
Кроме того, для любой данной независимой переменной T, давайте рассмотрим его как линейную функцию в одноразовой модели регрессии, где β0 это перехват и β1 это склон и дается,
Общая логистическая функция P который выводит значение между 0 и 1 станет,
Мы видим, что данные, разделенные на два класса, могут быть смоделированы с использованием логистической функции для заданной переменной в линейной функции. Но отношение между входной переменной X и выходной вероятностью не может быть легко интерпретирована, что дается сигмоидной функцией, мы введем Логит (log-uD) Функция теперь, которая делает эту модель интерпретируемой линейной модами.
Функция logit (log-uds)
Функция Log-Adds, А.К.А Натуральный логарифм шансов , является обратным в стандартной логистической функции, которая может быть определена и дополнительно упрощена как,
В приведенном выше уравнении термины следующие:
g это Логит функция. Уравнение для g (p (x)) показывает, что логит эквивалентен выражению линейной регрессии
ln обозначает натуральный логарифм
p (x) Это вероятность зависимой переменной, которая падает в один из двух классов 0 или 1, учитывая некоторую линейную комбинацию предикторов
β0 это перехватить из уравнения линейного регрессии
β1 Коэффициент регрессии умножается на некоторое значение предиктора
Дальше упрощение вышеуказанного уравнения и экспоненты с обеих сторон мы можем вывести отношения между вероятностью и линейной моделью, как,
Левый срок называется шансы , который определяется как эквивалент экспоненциальной функции линейной регрессии выражения. С вспомогательный (База журнала E) с обеих сторон, мы можем интерпретировать соотношение как линейную между коэффициентами журнала и независимой переменной х Отказ
Почему регрессия?
Изменение вероятности p (x) С изменениями в переменной X не могут быть непосредственно поняты, так как он определяется функцией сигмовидной. Но с вышеуказанным выражением мы можем интерпретировать, что изменение в журналах переменных X является линейным относительно изменения переменной х сам. Участок журналов с линейным уравнением можно увидеть как,
Результат вероятности зависимой переменной показывает, что значение выражения линейного регрессии может варьироваться от отрицательной к положительной бесконечности и все же после преобразования с сигмовидной функцией, результирующим выражением для вероятности p (x) колеблется между 0 и 1, то есть 0
Что делает логистическую регрессию алгоритмом классификации, будучи регрессией , это классифицирует ценность линейной регрессии к определенному классу в зависимости от границы решения.
Граница решения
Граница решения определяется как порог Значение, которое помогает нам классифицировать прогнозируемое значение вероятностей, заданное сигмовидной функцией, в определенный класс, положительный или отрицательный.
Линейное решение решений
Когда два или более классов могут быть линейно отделены,
Нелинейная граница
Когда два или более классов не линейно отделимы,
Многоклассная классификация
Основная интуиция позади Multi-Class И двоичная логистическая регрессия такая же. Однако для проблем с классификацией нескольких классов мы следуем ** * Один V/S Все классификации ** *. Если для модели существует несколько независимых переменных, традиционное уравнение модифицировано как,
Здесь журнал-шансы можно определить как линейно связанные с несколькими независимыми переменными, присутствующими, когда линейная регрессия становится многократной регрессией с м объясняет.
Например. Если нам придется предсказать, является ли погода солнечной, дождливой или ветреной, мы имеем дело с проблемой с несколькими классами. Мы превращаем эту проблему в третью проблему бинарной классификации, то есть ли она солнечно или нет, будь то дождливая или нет, и ли она ветрена или нет. У нас все три классификации самостоятельно На функциях ввода и классификации, для которой значение вероятности является максимальным относительным к другим, становится решением.
Вывод
Логистическая регрессия – одна из самых простых моделей машинного обучения. Они легко понять, интерпретируемо и могут дать довольно хорошие результаты. Каждый практикующий, использующий логистическую регрессию, должен знать о коэффициентов журнала, который является главной концепцией этого алгоритма обучения. Логистическая регрессия очень часто интерпретируется, учитывая потребности в бизнесе и объяснении в отношении того, как модель работает относительно различных независимых переменных, используемых в модели. Этот пост направлен на то, чтобы обеспечить простой способ понять идею регрессии и прозрачности, предоставляемой логистической регрессией.
Спасибо за чтение. Вы можете найти мою другую Машинное обучение Похожие сообщения здесь Отказ
Я надеюсь, что этот пост был полезным. Я ценю обратную связь и конструктивную критику. Если вы хотите поговорить об этой статье или другим связанным темам, вы можете бросить мне текст здесь или в LinkedIn Отказ
Оригинал: “https://dev.to/imsparsh/what-makes-logistic-regression-a-classification-algorithm-199l”