Рубрики
Без рубрики

Analisando Meus dados da netflix

Aqui Vamos Nós Para маис Им пост де Аналис де Дадо. Dessa Vez Mais Incrivel Ainda, Nós Não Vamos Ut … Теги с датошими, Python, Analyst, Wornintech.

Aqui Vamos Nós Para маис Им пост де Аналис де Дадо. Dessa Vez Mais Incrivel Ainda, Nós Não Vamos Utilizar Dados de Ertras Pessoas Para Fazer UMA Anlise, Vamos Utilizar Nossos Prósios Dados. Inflvel né?

Neste Artigo Vovê Vai Conseguir Responder Perguntas Relacionadas à серия E Assistics Por oice.

Perguntas Como:

  • Quanto Tempo Passei AssistIndo Detrinisada Serie Ou Filme?
  • Qual Horperada EU Mais Assisti?
  • Quais Foram OS Episódios Mais Assistidos?
  • EM Quais Dias Da Semana Eu Assisti Mais Episódios?
  • Em Que Hora Dia Dia Eu Assisto Episódios de Friends Com Mais Predência?

Primeiro Vou Começar Fazendo UMA Anlise Exploratória Geral Nos Dados. DEPOIS IREI FILTRAR OS DADOS E Analisar Mais Detalhadamente UMA SÉRIE DE COMÉDIA QUE EU AMO: Друзья.

Vamos lá ??

Para Começar Preciso Dizer Que Esta Anlise Foi Inspirada EM UM Artigo Postado Pelo DataQuest Отказ Ву Pedir Para Que que acessarem Esse Link , Onde Eles Explicaam O Passo Passo Para Solicitar Seus Dados Нет сайта DA Netflix. Além Dissos, Consege Veruge Ver Análise Feita Pelo Autor do Artigo.

COMO de Costume, Começamos Importanto As Bibliotecas Burnárias. Aqui, Para Essa Analishing Smples, Form Utilizadas Apenas Essas Três.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

Conhecendo E Advedo Os Dados

Vamos Conhecer Melhor Nossos Dados E PROPENA-LOS PARA A Anlise. Foram Feitas Transformações Bem interesentes, Tenho Certeza Que Vai Ser Eniquecedor Para Vovê. Depois de ler OS Dados Que Vieram No Formato CSV, Vamos Mastrar As 5 Primeiras Linhas Do Nosso DataFrame:

df = pd.read_csv('ViewingActivity.csv')
df.head()

Утилизандо О. .info () е .shape BOTEMOS Informações Sobre nossas Colunas e A kantidade de linhas e Colunas, обязательство.

df.shape

df.info()

Optei POR Eliminar Algumas Colunas Que Para Minha Analish Não Serriam Interesessantes.

ALÉM DISSO TAMBEM RENOMEEI A PAMEIRA COLUNA, APENAS DESSITUINDO O ESPAçO NO «Время начала» POR UM подчеркивает. E Carro, Verififiquei Austencia de Valores Nan.

df.drop(['Profile Name', 'Attributes', 'Supplemental Video Type', 'Device Type',
         'Bookmark', 'Latest Bookmark', 'Country'], axis=1, inplace=True)
df.head()

Convertrodo Tipo объект EM DateTime E TimEdelta

ОС Dados Das Colunas 'Start_time' е «Продолжительность» Parecem Corretos, Mas SE VOCê Reparar Bem Eles Não Estão Armazenados Нет Formato Correto. Подемос Усир df.dtypes PARA OBTER UMA LISTA DOS TIPOS DE DADOS DE CADA COLUNA DO NOSSO DATAFRAME:

df.dtypes

Тодас как Três Colunas São Armazenadas Como объект o que значимость que são Строки Отказ ISSO NãO E BOM PARA AS DUAS COLUNAS RELACINADAS AO TEMPO. Vamos Converter Essas Duas Colunas Para Trabalharmos Com Elas.

O objetivo é:

  • Конвертер Start_time PARA DateTime (UM Formationo de data e hora que o Pandas Pode Entender E Realizar Cálculos)
  • Конвертер Start_time DE UTC PARA NOSSO FUSO HORARIO LOAD
  • Конвертер Продолжительность пункт TimEdelta (UM Formato de Duração de Tempo que o. Pandas Podem entender e realizar cálculos)

Começando Com A Conversão Start_time PARA TATETIME USANDO pd.to_dateTime ()

ADICIONAMOS O AGRAGEO OPCION UTC = True. Para que nossos dados de data e hora tenham o fuso horário UTC Anexado a Eles. Agora Que Temos Essa Coluna No Formato Correto, É Hora de edhnar o Fuso Horário Para o Horário Local.

Подемос Конвертер Данные E Hora Para Qualkquer Fuso Horário Usando O .tz_convert. () E PassAndo Ur ArugeO Com ряд Para o Fuso Horário que queremos Converter.

OBS: Precisamos Realizar Mais UM Passo. Só PodeMos Usar. .tz_convert. () EM UM DateTimeIndex, Portanto, Precisamos Defire Coluna Start_time Como O índice Усандо set_index () Отказ

Agora, Vamos Lidar Com Coluna Продолжительность Отказ EM VEZ de Convertê-lo EM AMMA Data Ema Ema, Precisamos Conventrate-LO EM TimeTelta, Que É Umma Medida de Duração de Tempo que o Pandas Entende.

Fazemos Isso Утилизандо pd.to_timedelta ()

Análise de Dados Gerais

SE Notarmos Bem, Coluna Название CONTÉM O. NOME DA SÉRIE (OU FILLE), TREMADA E TíULO DO EPISóODIO. Essas Informações Poderiam Ser “Quebradas” Em Novas Colunas, Concordam?

E Foi Exatamente Isso Que Eu Fiz Нет Código Abaixo Utilizando str.split ()

Алем Диссо, Дециди Кррес Мэйс Дуас Колунас Парты-да Кленна 'Start_time' Отказ COMO Temos Data E Hora, Criei Coluna «Будний день» que nos informa o dia dia da semana,) e a Coluna «Час» com o horário.

Подемос Usar OS Métodos .dt.week е. dt.hour Para Fazer Isso.

Quantas Vezes Foi Dado Play Em Cada Séried/Filme?

Qual É O Топ 10 серии/Фильмы Mais Assistidos?

Análise de dados – друзья

COMO DITO Ansormente, IRei Fazer UMA Análise Mais Detalhada Selecionando Apenas Registros Relacionados à Série Друзья Отказ

PARA ISSO IREI КРИР ХРИР УМ ВЫВОДА ДАНАФРАМ СОМЕНТЕ COM REGIGNOROS ONDE 'Title_name' é agual à друзья. Aqui Vovo Wode Adaptar Selecionando Sua Série Ou Filme Purediedo.

Percebemos EM Nossa Exploração de Dados Que, QuAnto Algo Como Uma Previa de UM Episódio é Reproduzido, ELE COMO UMA Visualização em nossos dados.

Então, Vamos Filtrar Nosso DataFrame Друзья , Livielando Para Apenas Linhas Onde O Valor de Продолжительность Seja Maior que dois minutos.

Ответендо Mais Algumas Perguntas:

Quanto Tempo Passei Assistindo друзей?

Confesso Que Esperava Mais Até Haha. NãO SEI VOCOS, MAS EU TENHO O COSTUME DAR PLAY EM ALGUMA SÉRIE Enquanto Faço Outra Coisa Só Para Ter Um “Compamhia” Enquanto, POR Exemplo, Lavo a Louça, Arrumo Casa, Almoço, Janto … Então Na Verdade, UMA Parte Desse Tempo Nem Foi Assistindo Ativamente.

Qual Horperada de Friends Eu Mais Assisti?

Caso Vovê Não Saiba, Temporada 10 é altima temporada de friends, Está ai o o porquê de ser a vermada que menos ashizi, não gosto de ver os últimos episódios pois fico triste:(

Quais Foram OS Episódios Mais AssistiDos Em друзьями?

Mais Um Caso, Apesar de Smple, De Como A Análise de Dados é incrivel, ЕС Não Fazia Ideia de que Esse Era o Episódio que ЕС Mais Tinha AssistiDo Até Então.

Qual Dia dia da semana Costumo Assistir друзья?

print(friends.groupby('Weekday').agg({'Start_Time':'count'}))

# Monday=0, Sunday=6
plt.figure(figsize=(10,5))
ax = sns.countplot(x='Weekday', data=friends, color='blueviolet')
ax.set_title('Episódios de Friends assistidos por Dia da Semana', fontsize=17);

Sábado É O Dia Em Que Mais Assisti Episódio de друзей, Mas Veja Como Quarta-Feira Está Bem Próximo Também.

Em Que Hora Dia Dia Eu Assisto Episódios de Friends Com Mais Predência?

print(friends.groupby('Hour').agg({'Start_Time':'count'}))

plt.figure(figsize=(10,5))
ax = sns.countplot(x='Hour', data=friends, color='blueviolet')
ax.set_title('Episódios de Friends assistidos por Hora', fontsize=17);

POR ESSA EU JA ESPERAVA … COMO EU Discess, Costumo Assistir Episódios Enquanto Estou Almoçando, Isso Justifica O Porce Dessa Barrinha Taao Grande No Horário de 12h.

Aqui Vovê Encontra Minha Anlise Нет GitHub: https://bit.ly/2uo7jl5.

Espero que quecs tenham Gostado do Post e da Análise, FOI ALGO STRPERS, MAS CREIO QUE CONSEGUI MOSTRAR COMO CONSEGUIMOS USAR ESSAS Técnicas Para Saber Mais Sobre Nossos Gostos E Hábitos. NãA Esqueçam de Conferir Meus посты Нет LinkedIn мне Seguir POR LA ♥

Contacatos:

Оригинал: “https://dev.to/beatrizmaiads/analisando-meus-dados-da-netflix-40c”