Подписаться на мой YouTube канал
Команда исследований на рынке в Adright присваивается задача определить профиль типичного клиента для каждой продукции беговой дорожки, предлагаемого CardioGood Fitness. Группа исследований на рынке решает расследовать, есть ли различия в линиях продукта в отношении характеристик клиентов. Команда решает собрать данные по физическим лицам, которые приобрели беговую дорожку на розничной торговле кардиодонестими в течение трех месяцев. Данные хранятся в CardioGoodFitness.csv файл.
Команда идентифицирует следующие переменные клиентов для изучения:
- приобретенный продукт, TM195, TM498 или TM798;
- Пол;
- Возраст, в годы;
- образование, в годы;
- Состояние отношения, одиночные или партнерские;
- Годовой доход домохозяйств ;
- Среднее количество раз, когда клиент планирует использовать беговую дорожку каждую неделю;
- Среднее количество миль Заказчик рассчитывает пройти/проходить каждую неделю;
- Фитнес самооценки на шкале от 1 до 5, где 1 – плохая форма, а 5 – отличная форма.
Выполните описательную аналитику для создания профиля клиента для каждой линейки продукта беговой дорожки Fitness CardioGood.
# Load the necessary packages import numpy as np import pandas as pd # Load the Cardio Dataset mydata = pd.read_csv('CardioGoodFitness-1.csv') mydata.head()
Голова:
Хвостик:
Описывать:
mydata.describe(include="all")
Информация:
Гистограмма:
import matplotlib.pyplot as plt %matplotlib inline mydata.hist(figsize=(20,30))
BoxPlot:
import seaborn as sns sns.boxplot(x="Gender", y="Age", data=mydata)
Парный участок
Crosstab:
CountPlot:
Пивота:
Корреляция с тепловой картой:
Другие полезные ссылки:
https://numpy.org/ https://pandas.pydata.org/ https://seaborn.pydata.org/ https://matplotlib.org/
Оригинал: “https://dev.to/iamvigneshc/machine-learning-journey-day-4-python-descriptive-statistics-case-study-1dk5”