Автор оригинала: FreeCodeCapm Team.
Шуби Астхана
Python часто является языком выбора для разработчиков, которые необходимо применить статистические методы или анализ данных в их работе. Он также используется учеными данных, задачи которых должны быть интегрированы с веб-приложениями или производственными условиями.
Python действительно сияет в области машинного обучения. Его комбинация последовательного синтаксиса, более короткого времени разработки и гибкости делает его хорошо подходящим для разработки сложных моделей и прогнозных двигателей, которые могут напрямую подключиться к производственным системам.
Один из самых больших активов Python – это его обширный набор библиотек.
Библиотеки – это наборы процедур и функций, которые написаны на данном языке. Устойчивый набор библиотек может облегчить разработчикам выполнять сложные задачи, не переписывая много строк кода.
Машинное обучение в значительной степени основано на математике. В частности, математическая оптимизация, статистика и вероятность. Библиотеки Python помогают исследователям/математикам, которые менее оснащены знаниями о разработчике для легкомысленного «делать машинное обучение».
Ниже приведены некоторые из наиболее часто используемых библиотек в машинном обучении:
Scikit – учиться для работы с классическими алгоритмами ML
Scikit – Учите является одним из самых популярных ML библиотек. Он поддерживает многие контролируемые и безоговорочные алгоритмы обучения. Примеры включают линейные и логистические регрессии, деревья решений, кластеризация, k-средства и так далее.
Он основан на двух основных библиотеках Python, Numpy и Scipy. Он добавляет набор алгоритмов для общего машиностроения и задач добычи данных, включая кластеризацию, регрессирую и классификацию. Даже задачи, такие как данные преобразования, выделение функций и ансамблевые методы могут быть реализованы в нескольких линиях.
Для новичка в ML Scikit-Learn – это более чем достаточный инструмент для работы, пока вы не начните реализовать более сложные алгоритмы.
Tensorflow для глубокого обучения
Если вы находитесь в мире машинного обучения, вы, вероятно, слышали, попробовали или реализовали некоторую форму глубокого алгоритма обучения. Они необходимы? Не всегда. Они круто, когда закончите правильно? Да!
Интересная вещь о Tensorflow Это когда вы пишете программу в Python, вы можете компилировать и работать на вашем процессоре, либо GPU. Таким образом, вам не нужно писать на уровне C ++ или CUDA, чтобы запустить на GPU.
Он использует систему многослойных узлов, которая позволяет быстро настроить, поезда и развертывать искусственные нейронные сети с большими набора данных. Это то, что позволяет Google определить объекты на фотографиях или понять разговорные слова в приложении голоса.
Theano также для глубокого обучения
Theano Еще одна хорошая библиотека Python для численного вычисления и похожа на Numpy. Theano позволяет вам определить, оптимизировать и оценивать математические выражения, связанные с эффективными многомерными массивами.
Что устанавливает Theano Apart, это то, что он использует преимущество графического процессора компьютера. Это позволяет ему делать интенсивные расчета в 100 раз быстрее, чем при проведении только в процессоре CPU. Скорость Theano делает его особенно ценным для глубокого обучения и других вычислительно сложных задач.
Окончательный выпуск библиотеки Theano был в прошлом году – 2017, версия 1.0.0 с большим количеством новых функций, изменений и улучшений интерфейса.
Панда для удаления и подготовки данных
Pandas – очень популярная библиотека, которая предоставляет структуры данных высокого уровня, которые просты в использовании, а также интуитивно понятные.
Он имеет много встроенных методов группировки, объединения данных и фильтрации, а также анализ временных серий.
Пандас может легко получить данные из различных источников, таких как базы данных SQL, CSV, Excel, файлы JSON и манипулируют данные для выполнения операций на нем. В библиотеке есть две основные структуры:
- «Серия» – одномерное
- «Рамы данных» – два размера.
Для получения более подробной информации о том, как использовать серии и данные данные, проверьте мой другой Блог пост Отказ
Matplotlib для визуализации данных
Лучшие и самые сложные ML не имеют смысла, если вы не можете сообщить об этом другим людям.
Так как на самом деле вы на самом деле поворачиваетесь со всех этих данных, которые у вас есть? Как вы вдохновляете свои бизнес-аналитики и расскажите им «истории», полные «Insights»?
Это где Матплотлиб приходит к спасению. Это стандартная библиотека Python, используемая каждому ученым данных для создания 2D участков и графиков. Это довольно низкий уровень, то есть требуется больше команд для генерации красивых графов и цифр, чем с некоторыми расширенными библиотеками.
Тем не менее, оборотная сторона это гибкость. С достаточными командами вы можете сделать практически любой вид графика, который вы хотите с помощью MATPLOTLIB. Вы можете построить разнообразные графики, от гистограмм и разбросах к не-картезированным графам координат.
Он поддерживает различные репутации GUI по всем операционным системам, а также могут экспортировать графику в общие векторные и графические форматы, такие как PDF, SVG, JPG, PNG, BMP, GIF и т. Д.
Meeborn – это еще одна библиотека визуализации данных
Морской является популярной библиотекой визуализации, которая строит на основании Matplotlib. Это библиотека более высокого уровня, означающая, что легче генерировать определенные виды участков, в том числе тепловых карт, временных серий и слои на скриптах.
Заключение
Это коллекция самых важных библиотек Python для изучения машины. Эти библиотеки стоит посмотреть, а также ознакомиться с, если вы планируете работать с Python и Data Science.
Я пропустил какую-либо важные библиотеки Python ML? Если это так, пожалуйста, не забудьте упомянуть его в комментариях ниже. Несмотря на то, что я пытался охватить самые полезные библиотеки, я все равно не охватил некоторых других, которые заслуживают, чтобы смотреть.
Вопросы или обратная связь? Я хотел бы услышать от вас – пожалуйста, не стесняйтесь оставлять комментарий или связаться со мной на t Witter / LinkedIn Отказ