Рубрики
Без рубрики

Некоторые панды удобные фрагменты для данных ученых

Итайте через строки импортируют панды как PD для индекса, строка в DF.Iterrows (): Pass … Теги с Python, учебником, начинающим, машины.

Итерация через ряды

import pandas as pd

for index, row in df.iterrows():
    pass

Подсчитайте уникальные значения в DataFrame

df.labels.value_counts()

Максимальное значение стиля в ряд или столбце

# Inspired by https://stackoverflow.com/a/45606572/2874139
def highlight_max(data, color='yellow', isBold=True):
    # Styling
    attrs = []
    if color is not None:
        attrs.append(f'background-color: {color}')
    if isBold:
        attrs.append('font-weight: bold')
    attrs = '; '.join(attrs)

    if data.ndim == 1:
        is_max = data == data.max()
        return [attrs if value else '' for value in is_max]
    else:
        is_max = data == data.max().max()
        return pd.DataFrame(np.where(is_max, attrs, ''), index=data.index, columns=data.columns)

df.style.apply(highlight_max, axis=1) # Max in row
df.style.apply(highlight_max, axis=0) # Max in column

Дисплей 1000 строк и столбцов

# source: fast.ai material
def display_all(df):
    with pd.option_context("display.max_rows", 1000, "display.max_columns", 1000): 
        display(df)

display_all(df)

Сохранить DataFrame в качестве файла CSV

# index specifies whether to add a sequential index to the saved file
df.to_csv(csv_path, index=False)

Создать DataFrame Form Python Словарь

all_questions = []  # rows of column 'all_questions'
all_good_answers = []  # rows of column 'all_good_answers'
all_bad_answers = []  # rows of column 'all_bad_answers'

qa_dict = {'question': all_questions, 'good_answer': all_good_answers, 'bad_answer': all_bad_answers}

# Create a dataframe with 3 columns: question, good_answer and bad_answer
df = pd.DataFrame(data=qa_dict)

Даты анализа в dataframe

df = pd.read_csv("train.csv", low_memory=False, parse_dates=["createddate"])

Я работаю над проектом под названием ML Studio Хотите получить ранний доступ и обновления продукта? Подписаться здесь или следовать за мной на Twitter Отказ

Оригинал: “https://dev.to/mgazar_/some-pandas-handy-snippets-for-data-scientists-4k4l”