Итерация через ряды
import pandas as pd for index, row in df.iterrows(): pass
Подсчитайте уникальные значения в DataFrame
df.labels.value_counts()
Максимальное значение стиля в ряд или столбце
# Inspired by https://stackoverflow.com/a/45606572/2874139 def highlight_max(data, color='yellow', isBold=True): # Styling attrs = [] if color is not None: attrs.append(f'background-color: {color}') if isBold: attrs.append('font-weight: bold') attrs = '; '.join(attrs) if data.ndim == 1: is_max = data == data.max() return [attrs if value else '' for value in is_max] else: is_max = data == data.max().max() return pd.DataFrame(np.where(is_max, attrs, ''), index=data.index, columns=data.columns) df.style.apply(highlight_max, axis=1) # Max in row df.style.apply(highlight_max, axis=0) # Max in column
Дисплей 1000 строк и столбцов
# source: fast.ai material def display_all(df): with pd.option_context("display.max_rows", 1000, "display.max_columns", 1000): display(df) display_all(df)
Сохранить DataFrame в качестве файла CSV
# index specifies whether to add a sequential index to the saved file df.to_csv(csv_path, index=False)
Создать DataFrame Form Python Словарь
all_questions = [] # rows of column 'all_questions' all_good_answers = [] # rows of column 'all_good_answers' all_bad_answers = [] # rows of column 'all_bad_answers' qa_dict = {'question': all_questions, 'good_answer': all_good_answers, 'bad_answer': all_bad_answers} # Create a dataframe with 3 columns: question, good_answer and bad_answer df = pd.DataFrame(data=qa_dict)
Даты анализа в dataframe
df = pd.read_csv("train.csv", low_memory=False, parse_dates=["createddate"])
Я работаю над проектом под названием ML Studio Хотите получить ранний доступ и обновления продукта? Подписаться здесь или следовать за мной на Twitter Отказ
Оригинал: “https://dev.to/mgazar_/some-pandas-handy-snippets-for-data-scientists-4k4l”