Рубрики
Без рубрики

Визуализация данных с Python Searborn и Pandas

Эй, ребята! Сегодня мы будем раскрывать очень интересный модуль модуля Python – Meeborn Module и будем понимать его вклад в данные

Автор оригинала: Pankaj Kumar.

Эй, ребята! Сегодня мы раскрываем очень интересный модуль Python – Модуль морского модуля и будет понимание его вклада в Визуализации данных Отказ

Нужен модуль морского модуля

Визуализация данных является представлением значений данных в живом формате. Визуализация данных помогает достичь лучшего понимания и помогает выделять идеальные выводы из данных.

Python Matplotlib Библиотека Обеспечивает базу для всех модулей визуализации данных, присутствующих в Python. Модуль Python Seanborn построен над модулем MatPlotlib и обеспечивает функции с лучшей эффективностью и элементами графика, придумываемых в нем.

С Seborborn, данные могут быть представлены различными визуализациями, а к нему можно добавить различные функции для улучшения изобразительного представления.

Визуализация данных с Python Seborn

Чтобы начать работу с визуализацией данных с Seaborn, следующие модули должны быть установлены и импортированы в среду Python.

  • Осевать
  • Панда
  • Matplotlib.
  • Скопи

Примечание. Я связал вышеуказанные модули (в пуль) с ссылками статьи для справки.

Кроме того, нам нужно установить и загрузить модуль Python Searborn в окружающую среду.

pip install seaborn
import seaborn

Теперь, когда мы установили и импортировали модуль Seborn в нашей рабочей среде, давайте начнем работать с визуализациями данных в Searborn.

Статистическая визуализация данных с морским

Модуль Python Searborn помогает нам визуализировать и изображать данные в статистических терминах I.e. Понимание взаимосвязи между значениями данных с помощью следующих участков:

  1. Сюжет линии
  2. Разброс

Давайте понять каждого из них подробно в предстоящих разделах.

Сюжет морской линии

Сюжет линии Seborn изображает взаимосвязь между значениями данных среди набора точек данных. Сюжет линии помогает изображать зависимость переменной/значения данных по другому значению данных.

Seanborn.LinePlot () Функция Указывает линию из точек данных, чтобы визуализировать зависимость переменной данных по другой переменной параметрической информации.

Синтаксис:

seaborn.lineplot(x,y)

Пример 1:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.lineplot(data['hp'],data['cyl'])
plt.show()

Выход:

Пример 2:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.lineplot(data['hp'],data['cyl'],hue=data['am'],style=data['am'])
plt.show()

В приведенном выше примере мы изобразили связь между различными значениями данных с использованием параметра оттенок и Стиль изобразить отношения между ними с использованием различных стилей построения.

Выход:

Searborn разброс

Участок разброса Searborn также помогает изобразить взаимосвязь между различными значениями данных против непрерывного/категориального значения данных (параметр).

Рассованный участок широко используется для обнаружения выбросов в области визуализации данных и очистки данных. Выбросы – это значения данных, которые лежат вдали от обычного диапазона всех значений данных. Участок разброса помогает визуализировать точки данных и выделить выбросы из него.

Синтаксис:

seaborn.scatterplot()

Seaborn.scatterplot () Функциональные графики данных точек данных в кластерах точек данных, изображающих и визуализируйте взаимосвязь между переменными данных. Во время визуализации модели данных нам необходимо разместить зависимые значения или значения переменного ответа на ось Y и независимых вариабельных значений на оси x.

Пример 1:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.scatterplot(data['hp'],data['cyl'])
plt.show()

Выход:

Пример 2:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.scatterplot(data['hp'],data['cyl'],hue=data['am'],style=data['am'])
plt.show()

С параметрами ‘ оттенок ‘и’ Стиль «Мы можем визуализировать несколько переменных данных с различными стилями построения.

Выход:

Категорическая визуализация данных с морским и пандами

Перед началом работы с категорическим распространением данных необходимо нам понять определенные условия, связанные с анализом данных и визуализацией.

  • Непрерывная переменная : Это переменная данных, которая содержит непрерывные и числовые значения. Например: возраст является непрерывной переменной, значение которой может лежать от 1 до 100
  • Категорическая переменная : Это переменная данных, содержащая дискретные значения I.E. в виде групп или категорий. Например: гендер может быть классифицирован на две группы – «мужчина», «женщина» и «другие».

Поняв основные терминологии, давайте погрузимся в визуализацию категорических переменных данных.

Ящик сюжет

Seanborn BoxPlot используется для визуализации категориальной/числовой переменной данных и широко используется для обнаружения Выбросы в процессе очистки данных.

Meanborn.BoxPlot () Метод Используется создать BoxPlot для определенной переменной данных. Структура коробки представляет основной квартиль сюжета.

Синтаксис:

seaborn.boxplot()

Две линии представляют нижний и верхний диапазон. Любая точка данных, которая лежит ниже нижнего диапазона или выше верхнего диапазона, считается выбросом.

Пример:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.boxplot(data['mpg'])
plt.show()

Выход:

В приведенном выше BoxPlot точка данных, лежа над верхним диапазоном, помечена как точка данных и рассматривается как выброс для набора данных.

Участок Beacen

Seanborn BoxenPlot напоминает Boxplot, но имеет небольшое различие в презентации сюжета.

Seaborn.BoxenPlot () Функция Указывает переменную данных с увеличенными межклассными кварцинами, изображающими подробное представление значений данных.

Синтаксис:

seaborn.boxenplot()

Пример:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.boxenplot(data['hp'])
plt.show()

Выход:

Скрипка

Скриптуальный участок морской скрипки Используется для представления базовых данных распределения данных переменных данных по его значениям данных.

Синтаксис:

seaborn.violinplot()

Пример:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.violinplot(data['hp'])
plt.show()

Выход:

Swarmplot.

Searborn Swarmplot дает лучшую картину с точки зрения описания отношений между категориальными переменными данных.

Seaborn.swarmplot () Функция создает рой точек данных вокруг значений данных, которые представляют собой отношение между двумя категориальными переменными/столбцами данных.

Синтаксис:

seaborn.swarmplot()

Пример:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.swarmplot(data['am'],data['cyl'])
plt.show()

Выход:

Оценка категориальных данных с использованием Searborn

В области анализа данных и визуализации мы часто требуем участки данных, которые помогают нам оценить частоту или количество определенных обследований/повторных поисков и т. Д. Следующие участки полезны для обслуживания той же цели:

  1. Барплот
  2. PointPlot.
  3. CountPlot

1. Барплот

Seanborn Barplot представляет распределение данных между переменными данных как Распределение частоты ценностей центральной тенденции.

Синтаксис:

seaborn.barplot()

Пример:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.barplot(data['cyl'],data['carb'])
plt.show()

Выход:

2. PointPlot.

PointPlot Meeborn – это сочетание статистической линии морской линии и рассеяния. Seanborn.PointPlot () Функция Представляет связь между переменными данных в виде точки разброса и линий, соединяющих их.

Синтаксис:

seaborn.pointplot()

Пример:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.pointplot(data['carb'],data['cyl'])
plt.show()

Выход:

3. CountPlot

Searborn CountPlot представляет значение или частоту переменной данных, передаваемой на нее. Таким образом, его можно рассматривать как одноразовый график распределения данных.

Синтаксис:

seaborn.countplot()

Пример:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.countplot(data['carb'])
plt.show()

Выход:

Univariate Distribution с использованием Seborn Distllot

Распространение Seborborn широко используется для одноразового распределения данных и визуализации I.E. Визуализация значений данных одной переменной данных.

Seaborn.distplot () Функция изображает распределение данных непрерывной переменной. Он представлен как гистограмма вместе с линией.

Синтаксис:

seaborn.distplot()

Пример:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.distplot(data['mpg'])
plt.show()

Выход:

Бивариатное распределение с использованием Searborn Kdeplot

Seaborn Kdeplot изображает статистическую вероятностное распределение представления нескольких непрерывных переменных.

Синтаксис:

seaborn.kdeplot()

Пример:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
res = sn.kdeplot(data['mpg'],data['qsec'])
plt.show()

Выход:

Установка разных фонов с использованием Searborn

Seaborn.Set () Функция Может использоваться для установки различного фона на участки, такие как « темный ‘,’ Уайтгрид ‘,’ Darkgrid ‘, так далее.

Синтаксис :

seaborn.set(style)

Пример:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas
data = pandas.read_csv("C:/mtcars.csv")
sn.set(style='darkgrid',)
res = sn.lineplot(data['mpg'],data['qsec'])
plt.show()

Выход:

Заключение

Таким образом, модуль Seborn помогает в визуализации данных с использованием разных участков в соответствии с целью визуализации.

Рекомендации