Путешествие на машине Учебное путешествие: День 4 (Python | Описательная статистика

Подписаться на мой YouTube канал

Команда исследований на рынке в Adright присваивается задача определить профиль типичного клиента для каждой продукции беговой дорожки, предлагаемого CardioGood Fitness. Группа исследований на рынке решает расследовать, есть ли различия в линиях продукта в отношении характеристик клиентов. Команда решает собрать данные по физическим лицам, которые приобрели беговую дорожку на розничной торговле кардиодонестими в течение трех месяцев. Данные хранятся в CardioGoodFitness.csv файл.

Команда идентифицирует следующие переменные клиентов для изучения:

приобретенный продукт, TM195, TM498 или TM798;
Пол;
Возраст, в годы;
образование, в годы;
Состояние отношения, одиночные или партнерские;
Годовой доход домохозяйств ;
Среднее количество раз, когда клиент планирует использовать беговую дорожку каждую неделю;
Среднее количество миль Заказчик рассчитывает пройти/проходить каждую неделю;
Фитнес самооценки на шкале от 1 до 5, где 1 – плохая форма, а 5 – отличная форма.

Выполните описательную аналитику для создания профиля клиента для каждой линейки продукта беговой дорожки Fitness CardioGood.

# Load the necessary packages

import numpy as np
import pandas as pd

# Load the Cardio Dataset

mydata = pd.read_csv('CardioGoodFitness-1.csv')

mydata.head()

Голова:

Хвостик:

Описывать:

mydata.describe(include="all")

Информация:

Гистограмма:

import matplotlib.pyplot as plt
%matplotlib inline

mydata.hist(figsize=(20,30))

BoxPlot:

import seaborn as sns

sns.boxplot(x="Gender", y="Age", data=mydata)

Парный участок

Crosstab:

CountPlot:

Пивота:

Корреляция с тепловой картой:

Другие полезные ссылки:

https://numpy.org/ https://pandas.pydata.org/ https://seaborn.pydata.org/ https://matplotlib.org/

Оригинал: “https://dev.to/iamvigneshc/machine-learning-journey-day-4-python-descriptive-statistics-case-study-1dk5”