Рубрики
Без рубрики

Учебник Python Altair: Создание интерактивных визуализаций

Python Altair – это уникальная библиотека визуализации данных, которая позволяет создавать интерактивные модели для визуализации данных. читать далее..

Автор оригинала: Pankaj Kumar.

Python Altair – это уникальная библиотека визуализации данных, которая позволяет создавать интерактивные модели для визуализации данных.

Чтобы стать хорошим ученым данных, возможность строить легко понятно, но важно сложные участки.

Идеальный способ сказать базовую историю ваших данных – сделать визуализацию.

Он иллюстрирует отношения в данных и обнародует информацию, которая не может быть передана только с номерами и цифрами, очевидными к человеческому глазу.

Но вы знаете, что еще лучше для обработки данных, чем визуализации? Визуализации, которые являются интерактивными!

Как новичок, к сожалению, это может показаться пугающей миссией.

Чтобы поддержать вас миссией, Python и R оба имеют широкий спектр инструментов и трюков.

Мы познакомим вас с Альтаир В этом руководстве.

С Altair, только с несколькими линиями кода и в очень короткое время вы сможете построить значимые, красивые и эффективные визуализации. Так что давайте начнем сейчас!

Что такое Python Altair?

Altair – библиотека Python, предназначенная для статистической визуализации. В природе он является декларативным (мы приедем к этому определению позже).

Он основан на Вега А Vega-Lite, оба из которых являются визуализационные грамматики, которые позволяют объяснить визуализацию визуализации и интерактивные действия в формате JSON.

В качестве ученого данных Altair позволит вам сосредоточить ваше время на ваши данные и прилагать больше усилий, чтобы понять, анализировать и визуализировать его, а не на требуемом коде.

Работа с библиотекой Python Altair

Давайте перейдем к работе с библиотекой Altair сейчас. Мы будем работать на DataSet Vega здесь. Я поделился ссылкой в разделе наборов данных.

1. Установка модуля Altair

Чтобы установить библиотеку Python Altair, мы можем использовать диспетчер пакетов PIP:

pip install altair
pip install vega_datasets

Я использую Google Colab, где он уже присутствует, поэтому мы можем напрямую импортировать:

import pandas as pd
import altair as alt
from vega_datasets import data as vega_data

2. Подготовка набора данных

Сегодня мы будем пользоваться DataSet Flucts_2K из Библиотека Vega-DataSets Отказ Я выбрал это, потому что он маленький, и не занимает много времени, чтобы загрузить, в отличие от библиотеки авиабилетов.

3. Получение данных с пандами

Мы можем получить данные из библиотеки, используя библиотеку Python Pandas и добавить тег «URL», как указано на первой строке ниже:

flights_data = pd.read_json(vega_data.flights_2k.url)
flights_data.head(10)

Это дает нам наши данные:

4. Построение набора данных с помощью Python Altair

Данные разработаны вокруг PandaS DataFrame в Altair, что означает, что вы можете управлять информацией в Altair так же, как вы можете взаимодействовать с PandaS DataFrame.

И во время Altair внутренне хранит данные в формате PandaFrame PandaS, существует несколько способов ввода информации.

Мы используем alt.chart Функция на сюжет:

alt.Chart(flights_data).mark_point().encode(
    alt.X('delay'),
    alt.Y('distance')
)

5. Изготовление участков интерактивных с помощью Altair

Теперь мы возьмем это на следующий уровень. Давайте добавим возможность взаимодействовать с участком, в том числе:

  • увеличить в сюжет
  • нажав на точки данных
  • Просмотр информации во время зависания

Добавьте подсказка вариант, а затем позвоните Интерактивный Функция:

alt.Chart(flights_data).mark_point().encode(
    alt.X('delay'),
    alt.Y('distance'),
    tooltip = [ alt.Tooltip('delay'),
               alt.Tooltip('distance'),
              ]
).interactive()

Это даст нам:

Как видите, мы можем увеличить, как мы хотим в набор данных, чтобы получить выводы.

Полная реализация интерактивного участка в Python

И это все. Я сделал кучу более интерактивных участков на моем ноутбуке Colab, используя эти коды, поэтому попробуйте их:

import pandas as pd
import altair as alt
from vega_datasets import data as vega_data
flights_data = pd.read_json(vega_data.flights_2k.url)
flights_data.head(10)

alt.Chart(flights_data).mark_point().encode(
    alt.X('delay'),
    alt.Y('distance'),
    tooltip = [ alt.Tooltip('delay'),
               alt.Tooltip('distance'),
              ]
).interactive()

alt.Chart(flights_data).mark_point(filled=True).encode(
    alt.X('origin'),
    alt.Y('delay'),
    alt.Size('distance')
)

median_delay = flights_data.groupby('origin').median()

alt.Chart(flights_data).mark_point(filled=True).encode(
    alt.X('origin'),
    alt.Y('destination'),
    alt.Size('distance')
    ).configure_mark(
    opacity=0.2,
    color='red'
)

Завершение примечания

Если вам понравилось читать эту статью и хочу прочитать больше, продолжайте следовать на сайте! У нас много интересных статей предстоящих в ближайшее время. Чтобы оставаться в курсе всех статей, не забудьте присоединиться к нам на Twitter и зарегистрироваться на рассылку для некоторых интересных читателей!