Когда имена методов похожи, трудно держать их в своем уме. Это запоминает их сильнее.
У Pandas есть множество методов для создания и настройки индекса данных. Это краткое руководство, которое поможет вам создать небольшое ментальное пространство между методами для более легкого запоминания.
Записная книжка Юпитера находится на Kaggle Здесь Анкет
import pandas as pd import numpy as np
Сделайте DataFrame без указания индекса (вы получаете индекс по умолчанию).
df = pd.DataFrame(dict(a=[1,2,3,4], b=[2,5,6,4])) df
1 | 2 | 0 |
2 | 5 | 1 |
3 | 6 | 2 |
4 | 4 | 3 |
Сделайте DataFrame с индексом, используя аргумент ключевого слова Index.
df2 = pd.DataFrame(dict(a=[1,2,3,4], b=[2,5,6,4]), index = [1,2,5,6]) df2
1 | 2 | 1 |
2 | 5 | 2 |
3 | 6 | 5 |
4 | 4 | 6 |
Переместите столбец, чтобы быть индексом с .set_index ()
df3 = df2.set_index("a") df3
1 | 2 |
2 | 5 |
3 | 6 |
4 | 4 |
Переименовать значения индекса с нуля с .индекс
df3.index = [2,3,4,5] df3
2 | 2 |
5 | 3 |
6 | 4 |
4 | 5 |
Обратите внимание, что Индекс
является свойством DataFrame, а не методом, поэтому синтаксис отличается.
Nuke значения индекса и начните с 0 с .reset_index ()
df4 = df3.reset_index() df4
2 | 2 | 0 |
5 | 3 | 1 |
6 | 4 | 2 |
4 | 5 | 3 |
Если вы не хотите, чтобы индекс стал столбцом, передайте DROP = Верно
к reset_index ()
Анкет
df5 = df3.reset_index(drop=True) df5
2 | 0 |
5 | 1 |
6 | 2 |
4 | 3 |
Переупорядочить ряды с помощью .reindex ()
df6 = df5.reindex([2,3,1,0]) df6
6 | 2 |
4 | 3 |
5 | 1 |
2 | 0 |
Пропуск значения, которого нет в индексе, приводит к NAN.
df7 = df5.reindex([2,3,1,0,6]) df7
6.0 | 2 |
4.0 | 3 |
5.0 | 1 |
2.0 | 0 |
НАН | 6 |
Совет
В идеале, добавьте индекс при создании своего DataFrame с index =
Анкет
При чтении из файла .csv вы можете установить столбец индекса, передавая номер столбца.
Например:
df.read_csv (my_csv,)
Или проход index_col = Ложный
исключать.
Как установить или изменить индекс:
df.set_index ()
– Переместите столбец в индексdf.index
– Добавить индекс вручнуюdf.reset_index ()
– Сбросить индекс в 0, 1, 2 …df.reindex ()
– Пересмотреть строки
Слово ассоциации, чтобы помнить:
set_index ()
– Переместите столбецИндекс
– руководство по эксплуатацииreset_index ()
– перезагрузитьReindex
– Изменение порядка
Сворачивать
Я надеюсь, что эта статья помогла вам создать небольшое ментальное пространство, чтобы поддерживать прямые методы индекса Pandas. Если это так, пожалуйста, дайте ему немного любви, чтобы другие люди тоже могли ее найти.
Я пишу о науке о данных, разработке, питоне и других вещах. Проверьте мой другой статьи Если что -то из этого звучит интересно.
Следуй за мной и подключись: Средний Dev.to Twitter LinkedIn Kaggle GitHub
Счастливой индексации!
Оригинал: “https://dev.to/discdiver/how-to-remember-pandas-index-methods-3l0d”