Pandas 1.0.0 был выпущен. В этом посте я составил список важных изменений, которые были внесены.
Быстрее df.apply ()
Apply Now поддерживает ключ двигателя, который позволяет пользователю выполнять подпрограмму с помощью NUMBA вместо цинтона. Для строк более 1 миллиона двигатель Numba может привести к значительному увеличению скорости.
Выделенный тип данных строки
Тип строковых данных теперь отделен от типа данных объекта. Тип строковых данных все еще экспериментальный и, вероятно, не должен использоваться в производственном коде. Но приятно видеть выделенный тип строки в наборе данных. Кроме того, в тех случаях, когда вам необходимо дифференцировать типы данных строки и объекта в данных, это изменение пригодится.
На Синглтон Обозначать пропущенные значения
Панды использовали несколько значений для представления пропущенных данных:
- np.nan для данных плавания
- np.nan или нет для данных о объектном ткани
- ПД NAT для данных, подобных данным.
ПД NA обеспечивает «отсутствующий» индикатор, который можно последовательно использовать для типов данных.
Таблица разметки
Кадр данных теперь может быть напечатана как таблица разметки с использованием df.to_markdown ()
Лучшее резюме с DataFrame.info ()
Резюме DataFrame теперь использует более читаемый стиль
Вы можете использовать PIP Install.0.0RC0
Чтобы установить Pandas 1.0 в вашу среду Python.
Оригинал: “https://dev.to/anshaj/what-s-new-in-pandas-1-0-215l”