Рубрики
Без рубрики

Как запомнить методы индекса панда

Когда имена методов похожи, трудно держать их в своем уме. Это запоминает … Tagged с помощью Python, Tuperial, MachineLearning, Pandas.

Когда имена методов похожи, трудно держать их в своем уме. Это запоминает их сильнее.

У Pandas есть множество методов для создания и настройки индекса данных. Это краткое руководство, которое поможет вам создать небольшое ментальное пространство между методами для более легкого запоминания.

Записная книжка Юпитера находится на Kaggle Здесь Анкет

import pandas as pd
import numpy as np

Сделайте DataFrame без указания индекса (вы получаете индекс по умолчанию).

df = pd.DataFrame(dict(a=[1,2,3,4], b=[2,5,6,4]))
df
1 2 0
2 5 1
3 6 2
4 4 3

Сделайте DataFrame с индексом, используя аргумент ключевого слова Index.

df2 = pd.DataFrame(dict(a=[1,2,3,4], b=[2,5,6,4]), index = [1,2,5,6])
df2
1 2 1
2 5 2
3 6 5
4 4 6

Переместите столбец, чтобы быть индексом с .set_index ()

df3 = df2.set_index("a")
df3
1 2
2 5
3 6
4 4

Переименовать значения индекса с нуля с .индекс

df3.index = [2,3,4,5]
df3
2 2
5 3
6 4
4 5

Обратите внимание, что Индекс является свойством DataFrame, а не методом, поэтому синтаксис отличается.

Nuke значения индекса и начните с 0 с .reset_index ()

df4 = df3.reset_index()
df4
2 2 0
5 3 1
6 4 2
4 5 3

Если вы не хотите, чтобы индекс стал столбцом, передайте DROP = Верно к reset_index () Анкет

df5 = df3.reset_index(drop=True)
df5
2 0
5 1
6 2
4 3

Переупорядочить ряды с помощью .reindex ()

df6 = df5.reindex([2,3,1,0])
df6
6 2
4 3
5 1
2 0

Пропуск значения, которого нет в индексе, приводит к NAN.

df7 = df5.reindex([2,3,1,0,6])
df7
6.0 2
4.0 3
5.0 1
2.0 0
НАН 6

Совет

В идеале, добавьте индекс при создании своего DataFrame с index = Анкет

При чтении из файла .csv вы можете установить столбец индекса, передавая номер столбца.

Например:

df.read_csv (my_csv,)

Или проход index_col = Ложный исключать.

Как установить или изменить индекс:

  • df.set_index () – Переместите столбец в индекс

  • df.index – Добавить индекс вручную

  • df.reset_index () – Сбросить индекс в 0, 1, 2 …

  • df.reindex () – Пересмотреть строки

Слово ассоциации, чтобы помнить:

  • set_index () – Переместите столбец

  • Индекс – руководство по эксплуатации

  • reset_index () – перезагрузить

  • Reindex – Изменение порядка

Сворачивать

Я надеюсь, что эта статья помогла вам создать небольшое ментальное пространство, чтобы поддерживать прямые методы индекса Pandas. Если это так, пожалуйста, дайте ему немного любви, чтобы другие люди тоже могли ее найти.

Я пишу о науке о данных, разработке, питоне и других вещах. Проверьте мой другой статьи Если что -то из этого звучит интересно.

Следуй за мной и подключись: Средний Dev.to Twitter LinkedIn Kaggle GitHub

Счастливой индексации!

Оригинал: “https://dev.to/discdiver/how-to-remember-pandas-index-methods-3l0d”