Python – это язык программирования высокого уровня, который интерпретируется, интерактивный, портативный и объектно-ориентированный. Этот свободный и открытый источник общего назначения совместим с широким разнообразием вариантов Unix, включая Linux и MacOS и Windows.
Python используется при взломе, компьютерное зрение, визуализацию данных, обучение машину и робототехникам и является популярным языком программирования среди разработчиков по всему миру. В следующей таблице суммируется десять наиболее часто используемых библиотек Python для науки о данных:
Tensorflow
Tensorflow – это библиотека с открытым исходным кодом для глубоких учебных приложений, разработанных командой Google Brain.
Первоначально разработано для численных компиляций, он теперь включает в себя надежную и гибкую экосистему инструментов, библиотек и общественных ресурсов, которые позволяют разработчикам создавать и развертывать приложения на основе машин.
Tensorflow изначально выпущен в 2015 году, но команда Google Brain в последнее время выпустила свою последнюю версию Tensorflow 2.5.0, которая включает в себя дополнительные функции. Это Python 3.9 совместим.
Воплощение
Numpy или численный Python, был создан в 2015 году Travis Oliphant. Это основательная библиотека для математических и научных вычислений.
Программное обеспечение с открытым исходным кодом включает в себя линейную алгебру, преобразование Фурье и функции вычислений Matrix и в основном используется для приложений, которые требуют высокой производительности и эффективности ресурсов. Numpy Цель, чтобы обеспечить 50x более быстрыми объектами массива, чем традиционные списки Python.
Numpy является основой для научных библиотек данных, таких как Scipy, Matplotlib, Pandas, Scikit-Survey и Statsmodels.
Каникул
Scipy или Necience Python – это язык программирования, используемый для решения сложных математических наук, научных и инженерных проблем. Он основан на расширении NUMPY и обеспечивает манипулирование и визуализацию данных. Scipy – это пакет Python, который содержит удобные и эффективные численные процедуры для линейной алгебры, статистики, интеграции и оптимизации. Его приложения включают обработку многомерных изображений, решение преобразований Фурье и решение дифференциальных уравнений.
Matplotlib.
Матплотлиб, созданный Джоном Охотником, является одним из наиболее широко используемых библиотек в сообществе Python. Он может генерировать статические, анимированные и интерактивные визуализации данных. MATPLOTLIB позволяет множеству настроек и диаграмм.
Это позволяет разработчикам разбросать, настраивать и настроить участки с использованием гистограмм. Библиотека Open-Source включает в себя участки в приложения через объектно-ориентированные API.
Панда
Пандас были созданы WES Mckinney и используются для манипулирования и анализа данных. Он обеспечивает быструю, гибкую и выразительную структуру данных и функции, такие как выравнивание данных и обработка отсутствующих данных.
Pandas обеспечивают быструю, гибкую и выразительную структуру данных для работы с меченными и реляционными данными. Он построен на основании двух основных структур данных: серии и кадры.
Керас
KERAS – это бесплатная библиотека программного обеспечения с открытым исходным кодом. KERAS предоставляет интерфейс к библиотеке Tensorflow, что позволяет быстро прототипировать глубокие нейронные сети. Он был создан Франсуа Cholet и дебютировал в 2015 году.
KERAS включает в себя утилиты для модельной компиляции, визуализации графика и анализа данных. Кроме того, он обеспечивает предельные наборы данных, которые могут быть непосредственно импортированы и загружены. Это удобно, адаптируется и хорошо подходит для исследования исследований.
Scikit-Surve
Scikit-Sulect включает в себя алгоритмы классификации, регрессии и кластеризации, такие как DBSCAN, градиентное усиление, поддерживающие векторные машины и случайные леса.
Дэвид Курнапо разработал библиотеку на вершине Scipy, Numpy и Matplotlib для обработки повседневных средств машинного обучения и задачах добычи данных.
SCIKIT-SULL – это мощный инструмент для анализа прогнозирующих данных.
Statsmodels.
StatsModels – это научная библиотека Python, которая ориентирована на науку, анализ данных и статистике данных. Он основан на Numpy и Scipy и объединяет обработку данных с пандами. StatsModels позволяет пользователям выполнять исследование данных, оценку статистической модели и статистическое тестирование.
Сюжета
Сюжета – это совместная аналитика и графическая платформа, построенная в Интернете. Это одна из самых мощных библиотек, доступных для обучения машин, науки о данных и операций AI. Truelly – это готов к публикации и погружной инструмент визуализации данных.
Чутливо позволяет легко импортировать данные в диаграммы, позволяя разработчикам быстро создавать слайдные колоды и панели DishBoards. Он используется для создания таких инструментов, как Dash и Chart Studio.
Морской
Seanborn – это наиболее часто используемые статистические библиотеки визуализации визуализации данных в Python, используемые для создания тепломапочных операций и других визуализаций, которые суммируют данные и изображенные распределения. Он построен на верхней части MATPLOTLIB и поддерживает как рамы данных, так и массивы.
Meeborn используется для создания простых участков, таких как гистограммы, линии линии и круговые диаграммы.
Оригинал: “https://dev.to/letruong/the-best-python-libraries-for-data-science-in-2021-4am3”