Автор оригинала: Pankaj Kumar.
Эй, ребята! Сегодня мы раскрываем очень интересный модуль Python – Модуль морского модуля и будет понимание его вклада в Визуализации данных Отказ
Нужен модуль морского модуля
Визуализация данных является представлением значений данных в живом формате. Визуализация данных помогает достичь лучшего понимания и помогает выделять идеальные выводы из данных.
Python Matplotlib Библиотека Обеспечивает базу для всех модулей визуализации данных, присутствующих в Python. Модуль Python Seanborn построен над модулем MatPlotlib и обеспечивает функции с лучшей эффективностью и элементами графика, придумываемых в нем.
С Seborborn, данные могут быть представлены различными визуализациями, а к нему можно добавить различные функции для улучшения изобразительного представления.
Визуализация данных с Python Seborn
Чтобы начать работу с визуализацией данных с Seaborn, следующие модули должны быть установлены и импортированы в среду Python.
- Осевать
- Панда
- Matplotlib.
- Скопи
Примечание. Я связал вышеуказанные модули (в пуль) с ссылками статьи для справки.
Кроме того, нам нужно установить и загрузить модуль Python Searborn в окружающую среду.
pip install seaborn import seaborn
Теперь, когда мы установили и импортировали модуль Seborn в нашей рабочей среде, давайте начнем работать с визуализациями данных в Searborn.
Статистическая визуализация данных с морским
Модуль Python Searborn помогает нам визуализировать и изображать данные в статистических терминах I.e. Понимание взаимосвязи между значениями данных с помощью следующих участков:
- Сюжет линии
- Разброс
Давайте понять каждого из них подробно в предстоящих разделах.
Сюжет морской линии
Сюжет линии Seborn изображает взаимосвязь между значениями данных среди набора точек данных. Сюжет линии помогает изображать зависимость переменной/значения данных по другому значению данных.
Seanborn.LinePlot () Функция
Указывает линию из точек данных, чтобы визуализировать зависимость переменной данных по другой переменной параметрической информации.
Синтаксис:
seaborn.lineplot(x,y)
Пример 1:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.lineplot(data['hp'],data['cyl']) plt.show()
Выход:
Пример 2:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.lineplot(data['hp'],data['cyl'],hue=data['am'],style=data['am']) plt.show()
В приведенном выше примере мы изобразили связь между различными значениями данных с использованием параметра оттенок
и Стиль
изобразить отношения между ними с использованием различных стилей построения.
Выход:
Searborn разброс
Участок разброса Searborn также помогает изобразить взаимосвязь между различными значениями данных против непрерывного/категориального значения данных (параметр).
Рассованный участок широко используется для обнаружения выбросов в области визуализации данных и очистки данных. Выбросы – это значения данных, которые лежат вдали от обычного диапазона всех значений данных. Участок разброса помогает визуализировать точки данных и выделить выбросы из него.
Синтаксис:
seaborn.scatterplot()
Seaborn.scatterplot ()
Функциональные графики данных точек данных в кластерах точек данных, изображающих и визуализируйте взаимосвязь между переменными данных. Во время визуализации модели данных нам необходимо разместить зависимые значения или значения переменного ответа на ось Y и независимых вариабельных значений на оси x.
Пример 1:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.scatterplot(data['hp'],data['cyl']) plt.show()
Выход:
Пример 2:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.scatterplot(data['hp'],data['cyl'],hue=data['am'],style=data['am']) plt.show()
С параметрами ‘ оттенок
‘и’ Стиль
«Мы можем визуализировать несколько переменных данных с различными стилями построения.
Выход:
Категорическая визуализация данных с морским и пандами
Перед началом работы с категорическим распространением данных необходимо нам понять определенные условия, связанные с анализом данных и визуализацией.
- Непрерывная переменная : Это переменная данных, которая содержит непрерывные и числовые значения. Например: возраст является непрерывной переменной, значение которой может лежать от 1 до 100
- Категорическая переменная : Это переменная данных, содержащая дискретные значения I.E. в виде групп или категорий. Например: гендер может быть классифицирован на две группы – «мужчина», «женщина» и «другие».
Поняв основные терминологии, давайте погрузимся в визуализацию категорических переменных данных.
Ящик сюжет
Seanborn BoxPlot используется для визуализации категориальной/числовой переменной данных и широко используется для обнаружения Выбросы в процессе очистки данных.
Meanborn.BoxPlot () Метод
Используется создать BoxPlot для определенной переменной данных. Структура коробки представляет основной квартиль сюжета.
Синтаксис:
seaborn.boxplot()
Две линии представляют нижний и верхний диапазон. Любая точка данных, которая лежит ниже нижнего диапазона или выше верхнего диапазона, считается выбросом.
Пример:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.boxplot(data['mpg']) plt.show()
Выход:
В приведенном выше BoxPlot точка данных, лежа над верхним диапазоном, помечена как точка данных и рассматривается как выброс для набора данных.
Участок Beacen
Seanborn BoxenPlot напоминает Boxplot, но имеет небольшое различие в презентации сюжета.
Seaborn.BoxenPlot () Функция
Указывает переменную данных с увеличенными межклассными кварцинами, изображающими подробное представление значений данных.
Синтаксис:
seaborn.boxenplot()
Пример:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.boxenplot(data['hp']) plt.show()
Выход:
Скрипка
Скриптуальный участок морской скрипки Используется для представления базовых данных распределения данных переменных данных по его значениям данных.
Синтаксис:
seaborn.violinplot()
Пример:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.violinplot(data['hp']) plt.show()
Выход:
Swarmplot.
Searborn Swarmplot дает лучшую картину с точки зрения описания отношений между категориальными переменными данных.
Seaborn.swarmplot () Функция
создает рой точек данных вокруг значений данных, которые представляют собой отношение между двумя категориальными переменными/столбцами данных.
Синтаксис:
seaborn.swarmplot()
Пример:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.swarmplot(data['am'],data['cyl']) plt.show()
Выход:
Оценка категориальных данных с использованием Searborn
В области анализа данных и визуализации мы часто требуем участки данных, которые помогают нам оценить частоту или количество определенных обследований/повторных поисков и т. Д. Следующие участки полезны для обслуживания той же цели:
- Барплот
- PointPlot.
- CountPlot
1. Барплот
Seanborn Barplot представляет распределение данных между переменными данных как Распределение частоты ценностей центральной тенденции.
Синтаксис:
seaborn.barplot()
Пример:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.barplot(data['cyl'],data['carb']) plt.show()
Выход:
2. PointPlot.
PointPlot Meeborn – это сочетание статистической линии морской линии и рассеяния. Seanborn.PointPlot () Функция
Представляет связь между переменными данных в виде точки разброса и линий, соединяющих их.
Синтаксис:
seaborn.pointplot()
Пример:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.pointplot(data['carb'],data['cyl']) plt.show()
Выход:
3. CountPlot
Searborn CountPlot представляет значение или частоту переменной данных, передаваемой на нее. Таким образом, его можно рассматривать как одноразовый график распределения данных.
Синтаксис:
seaborn.countplot()
Пример:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.countplot(data['carb']) plt.show()
Выход:
Univariate Distribution с использованием Seborn Distllot
Распространение Seborborn широко используется для одноразового распределения данных и визуализации I.E. Визуализация значений данных одной переменной данных.
Seaborn.distplot () Функция
изображает распределение данных непрерывной переменной. Он представлен как гистограмма вместе с линией.
Синтаксис:
seaborn.distplot()
Пример:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.distplot(data['mpg']) plt.show()
Выход:
Бивариатное распределение с использованием Searborn Kdeplot
Seaborn Kdeplot изображает статистическую вероятностное распределение представления нескольких непрерывных переменных.
Синтаксис:
seaborn.kdeplot()
Пример:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") res = sn.kdeplot(data['mpg'],data['qsec']) plt.show()
Выход:
Установка разных фонов с использованием Searborn
Seaborn.Set () Функция
Может использоваться для установки различного фона на участки, такие как « темный ‘,’ Уайтгрид ‘,’ Darkgrid ‘, так далее.
Синтаксис :
seaborn.set(style)
Пример:
import seaborn as sn import matplotlib.pyplot as plt import numpy as np import pandas data = pandas.read_csv("C:/mtcars.csv") sn.set(style='darkgrid',) res = sn.lineplot(data['mpg'],data['qsec']) plt.show()
Выход:
Заключение
Таким образом, модуль Seborn помогает в визуализации данных с использованием разных участков в соответствии с целью визуализации.
Рекомендации
- Модуль Python Searborn – JournalDev
- Визуализация данных с Searborn – Askpython