Вступление
Существует несколько различных библиотек визуализации данных для Python. Однако из всех библиотек Matplotlib является самой популярной и широко используемой. С помощью Matplotlib вы можете создавать как простые, так и сложные визуализации.
Блокноты Jupyter-это один из самых популярных методов обмена данными и проектами анализа данных, кодом и визуализацией. Хотя вы можете знать, как визуализировать данные с помощью Matplotlib, вы можете не знать, как использовать Matplotlib в записной книжке Jupyter.
В этой статье мы рассмотрим как использовать блокнот IPython для построения графиков Matplotlib inline .
Он также будет охватывать назначение магических методов Matplotlib “inline” и “notebook”, которые используются для установки бэкендов Matplotlib.
Настройка Python
Блокноты Jupyter являются интерактивными, и если они позволяют вам делиться своей работой с другими программистами и аналитиками в воспроизводимом формате. Тем не менее, прежде чем вы сможете работать с ноутбуком Jupyter вам нужно установить его .
Самый простой и легкий способ установить ноутбук Jupyter – это использовать менеджер пакетов. Если вы используете Conda вы можете установить файловую систему Jupiter с помощью следующей команды:
$ conda install -c conda-forge notebook
Если вы используете pip, вы можете установить Jupyter с помощью этой команды:
$ pip install notebook
После установки Jupiter lab вы можете запустить экземпляр ноутбука Jupyter, открыв командную строку и используя следующую интуитивно понятную командную строку:
Jupyter Notebook
Затем вы можете получить доступ к своему блокноту Jupyter, указав в браузере следующий URL-адрес:
http://localhost:8888/tree?
Импорт данных и визуализация данных
Мы будем использовать знаменитый набор данных Tips .
Мы импортируем панд для чтения файла .csv
, а также matplotlib.pyplot
для визуализации. После этого мы можем построить простую точечную диаграмму :
Именно так вы обычно визуализируете данные в блокноте Jupyter. Однако если бы вы поделились этой записной книжкой с кем – то в ее нынешнем виде-им пришлось бы самим запускать код, чтобы увидеть визуализации.
Если вы хотите, чтобы сами визуализации были включены в тело записной книжки, вы используете команду inline
, которая ссылается на бэкэнд Matplotlib.
Бэкенды Matplotlib
Обычно отображение графиков включает в себя использование функции show()
из PyPlot. В блокнотах Jupyter это не обязательно, так как графики отображаются после запуска ячеек, содержащих код, который их генерирует. Эти графики по умолчанию отображаются встроенно , что означает, что они отображаются в самой записной книжке.
Однако вы также можете отобразить график вне блокнота, что можно сделать, изменив бэкэнд Matplotlib. Jupyter автоматически устанавливает бэкэнд Matplotlib, хотя это можно переопределить с помощью магических функций , которые вызываются с символом %
.
Matplotlib Plot On External Window using IPython/Jupyter
Давайте начнем с попытки построить график на внешнем окне из записной книжки:
%matplotlib qt
Здесь мы сказали блокноту Jupyter использовать Qt для генерации фрейма на нашей локальной машине. Этот вызов функции находится перед импортом Matplotlib:
Matplotlib Plot In line с использованием IPython/Jupyter (in line)
Некоторые версии Jupiter могут неправильно настроить бэкэнд для Matplotlib и не отображать графики в режиме онлайн. В этом случае встроенное построение может быть принудительно выполнено одним из двух способов.
Вы можете установить функцию inline
вместо qt
, чтобы заставить Jupyter отображать графики inline:
%matplotlib inline
Это помогает убедиться, что любой, кто открывает блокнот, может видеть визуализации без необходимости повторного запуска ячеек кода:
Matplotlib Plot Inline с использованием IPython/Jupyter (notebook)
Второй метод рендеринга графика Matplotlib в записной книжке-это использование бэкенда notebook
:
%matplotlib notebook
Использование %matplotlib notebook
создает интерактивные графики, встроенные в сам блокнот, позволяя тем, кто просматривает блокнот, делать такие вещи, как изменение размера рисунка или увеличение масштаба рисунка:
Вывод
В этом уроке мы рассмотрели, как построить external (используя Qt) и inline (используя inline
и notebook
magic functions) в ноутбуках IPython/Jupyter.
Если вы заинтересованы в визуализации данных и не знаете, с чего начать, обязательно ознакомьтесь с нашей связкой книг on :
Визуализация данных в Python с Matplotlib и Pandas – это книга, предназначенная для того, чтобы познакомить абсолютных новичков с Pandas и Matplotlib, обладающих базовыми знаниями Python, и позволить им создать прочную основу для продвинутой работы с библиотеками тезисов- от простых сюжетов до анимированных 3D-сюжетов с интерактивными кнопками.
Он служит углубленным руководством, которое научит вас всему, что вам нужно знать о пандах и Matplotlib, включая то, как создавать типы сюжетов, которые не встроены в саму библиотеку.
Визуализация данных в Python , книга для начинающих и промежуточных разработчиков Python, проведет вас через простые манипуляции с данными с Пандами, охватит основные библиотеки построения графиков, такие как Matplotlib и Seaborn, и покажет вам, как использовать преимущества декларативных и экспериментальных библиотек, таких как Altair. Более конкретно, в течение 11 глав эта книга охватывает 9 библиотек Python: Pandas, Matplotlib, Seaborn, Bokeh, Altair, Plotly, GGPlot, GeoPandas и VisPy.
Он служит уникальным практическим руководством по визуализации данных, в изобилии инструментов, которые вы могли бы использовать в своей карьере.